首页 > 资讯列表 > 科技资讯 >> 智能设备

快手前AI核心人物李岩创业,投身“大模型”赛道|36氪独家

智能设备 2023-03-08 10:25:06 转载来源: 网络整理/侵权必删

文|周鑫雨邓咏仪编辑|苏建勋杨轩又一名互联网技术大拿投身于AI赛道。36氪从多个独立信源处获悉,快手前MMU(Multimediaunderstanding,多媒体内容理解)负责人李岩在2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发

文 | 周鑫雨 邓咏仪

编辑 | 苏建勋 杨轩

又一名互联网技术大拿投身AI赛道

36氪从多个独立信源处获悉,快手前MMU(Multimedia understanding,多媒体内容理解)负责人李岩在2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发。36氪就上述信息向元石科技求证,得到了肯定的回复。

毕业于中国科学院计算技术研究所的李岩,是工号在75上下的快手老员工,也是快手AI技术研发的核心人物。2015年11月,在时任快手CEO的宿华的支持下,李岩组建了内部第一个深度学习部门DL(Deep Learning)组,目标是构建算法模型对违法违规的视频内容进行识别。

随着AI技术的积累,快手对视频内容理解产生了更多的需求。2016年,李岩将团队的名字从DL组改为MMU(Multimedia understanding,多媒体内容理解)组,在解决安全合规问题之外,涉猎语音、文字、图像等多种形式的算法模型研发。

几名知情人士表示,李岩于2021在快手提出离职,并于2022年下半年成立了元石科技。这一次独立创业,李岩也找到了最为适用于内容理解的技术路径——多模态大模型

所谓的多模态模型,指的基于文本、图像、视频、音频等多种模态数据进行学习训练的人工智能算法。简单而言,多模态模型就是一所AI综合院校,如百度即将发布的“文心一言”,就是基于多模态大模型“文心”训练而成的语言单模态模型。

早在2018年,李岩就在公开场合强调了多模态技术的重要性。在CNCC2018“高通量媒体内容理解论坛”上,李岩提到多模态内容理解对快手这样一家内容公司的战略意义:

“视频是视觉、听觉、文本多种模态综合的信息形式,而用户的行为也是另外一种模态的数据,所以视频本身就是一个多模态的问题,再加上用户行为就更是一种更加复杂的多模态问题。所以多模态的研究对于快手来说,是非常重要的课题。”

目前,国内企业的AI模型层竞争逐渐进入了白热化的阶段。前有百度、字节跳动等互联网大厂群雄逐鹿,后有创企利用各自的场景和数据优势竞相发力。

今年3月初,模型层企业又迎来两位强大的竞争者。3月2日,OpenAI以1000 tokens/$0.002(约等于100万个单词/18元)的“白菜价”发布了ChatGPT API。一天后,大股东微软在云计算平台Azure的全球版中正式上线了Azure OpenAI服务,支持企业级客户基于OpenAI的生成式AI模型进行场景创新和应用落地。

这对于成立于风口的元石科技而言,定是一场检验AI技术和行业沉淀的硬战。

36kr制图

36kr制图

标签: 快手 AI 核心 人物 李岩 创业 投身 大模型 赛道


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持