-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
EDG老岳怒斥Scout:没有底线!EDG给他开了顶薪,他还想要加钱
S13世界赛即将开赛,今年LNG战队在买下scout和gala双C后,实力提升明显,夏季赛拿到了亚军,成功晋级世界赛。而自从Scout离开EDG后,EDG这边对待Scout的态度和之前有了天壤之别,每次EDG和LNG赛前,EDG的海报都充满了嘲讽...
游戏资讯 2023-10-19 03:29:34 -
LOL-S13:Route卡莎拿到S13第一个五杀,LLL2比0击败GAM
北京时间10月10日,英雄联盟2023全球总决赛入围赛第一日的第二场比赛CBLOL赛区的LLL战队对阵VCS赛区的GAM战队。第一局LLL在对线期直接“完爆”GAM,下路Route的卡莎对线期打穿GAM的霞,LLL轻松拿下GAM第一局,Route的卡莎更是在最后一波团战拿到五杀;第二局GAM来到蓝色方,他们在前中期占据主动优势,LLL的奎桑提下路一波开到GAM的卡莎,帮助队伍止住劣势...
游戏资讯 2023-10-19 03:26:55 -
Scout世界赛前采访,比肩Faker终极目标,来LPL只因别无选择!
作为LPL赛区历史上最为顶尖的中单选手之一,目前效力于LNG的中单选手Scout在出征2023全球总决赛前接受了韩媒采访,在视频节目当中谈到了自己职业生涯的起点以及接下来的目标等等这些备受观众和粉丝瞩目的话题。从自己职业生涯参加SKT青训开始,到来到LPL成为世界知名的顶级中单,这段旅程背后的故事可以说是非常精彩...
游戏资讯 2023-10-19 03:24:01 -
《Enshrouded》steam试玩上线开放世界生存冒险
Keen Games GmbH工作室宣布,旗下一款开放世界生存合作冒险新游《Enshrouded》steam试玩上线,本作支持中文,感兴趣的玩家可以关注下了。《Enshrouded》游戏中,玩家将扮演火焰之子,一个濒死种族最后的希望火苗...
游戏资讯 2023-10-19 03:19:19 -
S13全球总决赛:PSG天秀两局,巴西Loud崩盘!卡莎是版本答案吗?
万众瞩目的英雄联盟S13全球总决赛,终于在10月10日鸣锣开赛。和以往不同的是,由于LPL和LCK两大赛区,在以往世界赛上的上佳表现...
游戏资讯 2023-10-19 03:18:27 -
S13全员加练永恩:Knight胜率高、Scout场次多,LCK主打上中摇摆
10月19日是S13世界赛瑞士轮开启的日子,届时LPL和LCK这两大顶级赛区的八支队伍将相继亮相。而每逢世界赛,版本英雄是无论如何都绕不开的话题。 本届世界赛使用的版本为13.19,虽然许多传统法师在该版本迎来了回归,但当下最受职业选手青睐的英雄却是永恩。这个上线伊始就有着不错人气的英雄,因为在技能机制方面比弟弟亚索更适合比赛,而屡屡登上了职业赛场。 永恩作为13...
游戏资讯 2023-10-19 03:09:57 -
《Troublemaker2》Steam页面2025年发售
今日(10月13日),城市RPG《Troublemaker2:BeyondDream》Steam页面上线,游戏不支持中文,预计于2025年发售,感兴趣的玩家可以点击此处进入商店页面。游戏介绍:青少年、梦想和毒品...
游戏资讯 2023-10-19 03:05:36 -
S13全球总决赛:GAM复仇Loud!越南赛区必有一支队伍进入瑞士轮
万众瞩目的英雄联盟S13全球总决赛,终于在10月10日鸣锣开赛。和以往不同的是,由于LPL和LCK两大赛区,在以往世界赛上的上佳表现...
游戏资讯 2023-10-19 03:01:21 -
欧美教练评级S13选手实力:Scout高居第1,Ruler第2!knight第4
S13世界赛入围赛的比赛正在进行中,而对于大多数观众来说,从瑞士轮开始才是真正的竞赛。最近欧美赛区前FNC教练Yamato和主播IWD发布了他们两人心目中的S13选手实力榜,一起来看看LPL选手们的排名如何吧!具体的排名如下,Yamato心目中最强选手是Scout,第二名是Ruler,第三名是Chovy,第四名是Knight,第五名是369,第六名是Kanavi,第七名是bin,第八名是Tarzan,第九名是Gala,第十名是Yagao...
游戏资讯 2023-10-19 03:00:46 -
S13入围赛:GAM2-0复仇LOUD,野王Levi成AD噩梦,CFO遗憾出局
随着入围赛阶段的比赛逐渐进行,在今日迎来了S13入围赛第五个比赛日的对决,在当天败者组第二轮的比赛中,GAM与BDS是毫无悬念地各自以2-0的比分战胜对手。由于四支队伍都是身处败者组,因此两场比赛的败者LOUD和CFO是遗憾出局,就此告别了全球总决赛的舞台无缘瑞士轮的比赛...
游戏资讯 2023-10-19 02:59:41 -
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0
新智元报道编辑:编辑部【新智元导读】ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。Stack Overflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、Github Copilot,Stack Overflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。所以,ChatGPT这类AI编码工具,真的要颠覆整个行业了?不过最近,普林斯顿和芝大的一项研究发现,LLM想要替代码农,其实没那么容易。论文地址:https://arxiv.org/abs/2310...
智能设备 2023-10-19 02:14:55