-
精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023
新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...
智能设备 2023-10-19 02:15:01 -
百度李震宇:大模型将走向多模态,塑造完全自动驾驶的汽车机器人
雷递网 乐天 10月17日百度创始人、董事长兼首席执行官李彦宏昨日在百度世界大会上表示:“未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界,自动驾驶就是视觉大模型重构物理世界的一个典型应用。大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖。”在当天下午的百度世界大会2023“大模型‘重构’智能汽车”论坛上,百度集团资深副总裁、智能驾驶事业群组总裁李震宇表示:大模型的“智能涌现”带来理解、生成、推理、记忆等核心能力的突破,让汽车具有EQ和IQ,将重构智能汽车业态。未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。萝卜快跑将越来越接近商业化盈利在智舱方面,语言大模型的上车,让人和车交互方式会从“命令式”升级到“对话式”,推动人车关系升级为人和虚拟人的关系。大模型将重构人车交互方式,让交互更加自然。以文心大模型为基础,百度Apollo为汽车座舱打造了专属大模型技术底座。人和车的交互不再需要复杂的按键操作,用语音就能操控,即便是七嘴八舌、多人指令、声音交织、连续对话的情况下,智能座舱也能理解每个人不同的需求,同时满足。目前,百度Apollo智舱大模型加持的产品将在极越01、凯迪拉克、别克、吉利银河等品牌车型中实现量产搭载。在智驾方面,通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及。百度称,百度Apollo纯视觉高阶智驾方案可应用于高速、城市、泊车等全域场景,将在今年第四季度实现量产,这是国内首个纯视觉方案在城市场景落地。去掉激光雷达让整车成本更低,提升了市场竞争力。大模型还将走向多模态,重构物理世界,自动驾驶就是大模型重构物理世界的一个典型代表。大模型让自动驾驶超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖,塑造出完全自动驾驶的汽车机器人。百度称,百度自动驾驶出行服务平台萝卜快跑,已经是全球最大的自动驾驶出行服务商,累计提供了超过400万次服务。随着运营规模的不断扩大、技术水平的不断提升,成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化盈利。李震宇表示,百度在人工智能、深度学习等领域投入超过十年,在智能汽车领域也探索了十年,十年日拱一卒的技术积累、实践是百度Apollo信心和底气的来源。大模型让全无人自动驾驶真正落地,汽车智能化的浪潮也将快速到来。大模型“重构”智能汽车的三条关键路径近年来,智能驾驶在用户整体购车因素的占比快速上升,在“选购前最重视因素”占比从1.2%突破到30%,成为用户购车核心决策因素。智能汽车市场正处在规模化量产前夕,智能汽车底层智能化技术也在发生重构,让AI原生出行时代更快到来。李震宇认为,大模型对智能汽车行业的重构主要体现在三个方面。语言大模型上车,人车交互方式会从“命令式”升级到“对话式”;通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及;未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。会上还发布了多款智驾和舱驾融合产品。百度Apollo量产的Apollo Highway Driving Pro进一步演进,发布了新一代Apollo City Driving,使得使用场景从封闭道路升级到城市开放道路,功能场景无限接近全域。百度称,纯视觉城市领航高阶智驾产品Apollo City Driving Max将于2023年第四季度量产落地。与此同时,百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台,它是中国首个能够完成甚至是全球首个真正意义上在单SOC上实现了舱驾融合运行的平台。活动现场,百度Apollo与航盛签署战略合作,宣布将共同基于高通平台打造新一代舱驾融合产品。雷递由媒体人雷建平创办,若转载请写明来源。 ...
智能设备 2023-10-19 02:14:57 -
大模型无法替代码农!普林斯顿芝大惊人发现:GPT-4解决GitHub编程问题成功率为0
新智元报道编辑:编辑部【新智元导读】ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。Stack Overflow,已经被ChatGPT创飞了!因为码农大量涌向ChatGPT、Github Copilot,Stack Overflow今天不得已宣布裁员100多人,几乎占员工人数的1/3。所以,ChatGPT这类AI编码工具,真的要颠覆整个行业了?不过最近,普林斯顿和芝大的一项研究发现,LLM想要替代码农,其实没那么容易。论文地址:https://arxiv.org/abs/2310...
智能设备 2023-10-19 02:14:55 -
智谱AI开源多模态大模型并官宣即将发布新一代大模型产品
【网易科技10月17日报道】近期,智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型,同样可以回答各种类型的视觉问题,可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。记者获悉,在多模态权威学术榜单上,目前CogVLM-17B是综合成绩第一的模型,在14个数据集中的10项权威跨模态基准上取得了SOTA性能,其余4项取得了第二名的成绩...
智能设备 2023-10-19 02:14:45 -
文心大模型4.0发布李彦宏:综合水平与GPT-4相比毫不逊色
李彦宏称文心一言4.0不逊GPT4 (来源:科技大佬见闻) 10月17日消息,百度创始人、董事长兼首席执行官李彦宏宣布文心大模型4...
业界动态 2023-10-19 02:14:18 -
微软向美国政府机构开放GPT-4大模型,含国防部、NASA等
IT之家 6 月 8 日消息,微软公司周三在一篇博客中宣布,该公司正在使用其 Azure 云服务把 OpenAI 的强大的语言生成模型引入美国政府构,这些模型包括 OpenAI 最新、最先进的大型语言模型(LLM)GPT-4,以及 GPT-3。OpenAI 推出的 ChatGPT 模型引发了 LLM 的热潮,各种规模的企业都在争相利用这些模型开发功能...
智能设备 2023-06-08 10:19:00 -
微软拟向美国国防部、NASA等机构开放GPT-4大模型
6月8日消息,美国当地时间周三,微软公司宣布将向其Azure Government云计算服务客户开放OpenAI的人工智能模型。这些客户包括多家美国政府机构,它们将能够访问GPT-3和GPT-4等大语言模型...
业界动态 2023-06-08 08:05:37 -
百度智能云:文心一言高性能模式推理性能提升50倍
6月6日消息,百度智能云在成都举行的文心大模型技术交流会上表示,自3月开始内测两个月以来,百度文心一言的推理性能已经提升10倍。同时,基于文心千帆大模型平台提供的完备的工具链,在企业应用的高频、核心场景中,文心一言的高性能模式“文心一言-Turbo”,其推理服务性能已经提升了50倍,这将极大提升客户的模型使用效果和效率...
互联网 2023-06-06 20:39:11 -
对话360孙浩:多模态大模型+物联网将是新风口
【网易科技6月5日报道】近日,360智慧生活推出360智脑·视觉大模型及360户外球机6 Pro等多款AI硬件新品,并宣布360智慧生活正式进军SMB(中小微企业)市场,实现从家庭场景到企业商用的全覆盖。在AI的落地应用上,360智慧生活已经探索多年,如今为何将视线放在了SMB市场?未来又将如何发展?针对这些话题,网易科技与360视觉云业务线总经理孙浩展开了深入交流...
智能设备 2023-06-05 10:25:26 -
度小满与哈工大共建“人工智能(大模型)联合研究中心”
6月1日消息,度小满与哈尔滨工业大学宣布共同成立“哈尔滨工业大学-度小满人工智能(大模型)联合研究中心”。双方将围绕大模型基座研发、大模型技术原理及其应用技术等领域展开前沿研究,旨在提升大模型的技术创新能力和实际应用效果。双方还将共同培养生成式人工智能技术领域的领军人才,推动前沿技术的产业化应用加速。度小满CEO朱光表示,“大模型时代已经开启,哈工大在人工智能基础研究、前沿理论研究上领先学界,度小满在人工智能应用上有海量数据、算力优势和工程能力,我们期待能够携手哈工大提升大模型技术的可靠性、安全性、精准性,推动技术创新成果从实验室走向规模化的产业应用,共同把握历史机遇”。哈尔滨工业大学校长韩杰才表示,“度小满在人工智能、大数据等相关领域具有雄厚的技术实力和应用经验,哈工大在人工智能、大模型等领域有着深厚的研究基础,近年来取得了一系列重要成果。未来,期望双方以本次签约为契机,强强联合,优势互补,力争突破大模型领域存在的关键共性‘卡脖子’问题,共同为构筑现代金融科技体系贡献应有的力量”。据了解,双方联合研究的课题包括大模型的思维链能力来源的探索、大模型长上下文建模、大模型快速适配声音、图像、文本等多模态数据、不同场景下大模型输出决策的可解释性等。近日,度小满还正式开源了千亿级中文金融大模型——“轩辕”。在金融场景中的任务评测中,轩辕赢得了150次回答中63.33%的胜率。在通用能力评测中,轩辕有10...
互联网 2023-06-01 18:09:32 -
阿里云AI新产品“通义听悟”宣布公测可体验大模型摘要能力
【网易科技6月1日报道】阿里云宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线。记者获悉,通义听悟接入了通义千问大模型的理解与摘要能力,可成为用户工作学习中的得力AI助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等...
智能设备 2023-06-01 11:32:44