-
AIAgent,启动!复旦NLP团队发86页长文综述,智能体社会近在眼前
新智元报道编辑:Lumina【新智元导读】近日,一篇探讨基于LLM的Agent综述论文在X上火了!仔细一看,论文署名中甚至一度还有米哈游。9月19日,Jim Fan转发了一篇来自复旦NLP团队对基于LLM的Agent的综述。Agent是能够感知自身所处环境、自我决策并采取行动的人工智能实体。该论文介绍了基于LLM Agent的一般概念框架,包括大脑、感知和行动;以及LLM Agent的应用场景、由LLM Agent组成的社会等。还讨论了LLM Agent领域中的一系列关键议题和开放性问题。有趣的是,在arXiv上提交的前两版论文中,注明了与米哈游合著,论文中则以原神中的海灯节为例,介绍了一个理想中的由AI Agent组成的社会。论文地址:https://arxiv.org/pdf/2309...
智能设备 2023-10-19 02:14:55 -
PSAI修图免费平替来了!StabilityAI又放大招,核弹级更新一键扩图
新智元报道编辑:编辑部【新智元导读】Stability AI再放大招,Uncrop Clipdrop一键扩图+重构图片,Photoshop Generative Fill免费平替来了。此前,PS的重建图像功能就让人无比振奋,让无数人惊呼今天,Stability AI又放大招了。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。从Uncrop这个名字上,我们就能看出它的用途。它是一个AI生成的「外画」工具,通过创建扩展背景,这个工具可以补充任何现有照片或图像,来更改任何图像的比例。敲黑板:通过Clipdrop网站,就可以免费试用这个工具了,无需登录!比例任意调,满意为止Uncrop基于Stability AI的文本到图像模型Stable Diffusion XL构建。通过先进的算法和深度学习技术,Uncrop会自动分析上传图像中的内容,然后生成视觉上合理的产出。这可解了许多修图师和画手的燃眉之急了。拍了一张近乎完美的照片,就是构图不尽人意,怎么办?Uncrop给你一键解决!很多时候,为了让图像显示在横幅或大画布上,我们都需要调整图像大小,把它调到合适的尺寸,而且不能扭曲,不能丢失重要的细节,Uncrop完全解决了这样的烦恼。拍出的横图想变竖图?Uncrop帮你解忧。竖图变横图?也是易如反掌。比例不合适的照片,可以随意拉到你想要的比例。不过呢,Uncrop也有自己的局限性。如果是极端的未剪裁图像,或者大量缺失内容的图像,会产生不太准确的结果。因此,我们需要尽可能确保原始图像的高质量,才能获得最佳效果。另外,Uncrop是依靠算法来分析周围的像素、填补空白,它的精度可能会因为场景的复杂性而不同。效果演示官方的介绍效果视频:网友们分享了自己做的外画效果实例:上手体验看到效果这么好,小编忍不住手痒了,立马上手实测了一波。实操起来感受就是:操作非常方便。就像上边的GIF展示的那样,选好一张图片,拖拽到页面中的指定区域。就可以像下图这样选择自己想要扩展的范围,然后等几秒钟,平台就会生成4张扩展完成的图片供你挑选保存。而且还可以针对某一张生成的图片结合Clipdrop的AI修图进行再加工。去除背景。锐化。再让AI对处理过的图片进行风格重构。经过几次AI的套娃生成加工之后,图片不仅仅被扩展了,还可以根据用户的具体需求进行风格和内容上的彻底「进化」。这时候,就是设计师们发挥自己的创造力的时候了!我们也针对人像,运动场景,静物场景做了一些测试。人像原图扩展效果扩展出来的部分效果确实挺自然。不过因为不能用Prompt指引方向,扩展的效果比较随机。重构效果扩展后重构效果AI生成人物图像的老问题手指解决的还是不理想。而且重构之后小姐姐的身体比例稍微有点问题,颜值也感觉降低了。静物原图扩展效果扩展效果比较自然,几乎看不出什么违和感。扩展重构效果但是重构之后线条扭曲的比较明显,整个画面的风格会有比较大的变化。运动场景原图扩展效果很敏感地捕捉到了图片的动态风格,扩展效果不错。扩展后重构效果重构之后主体已经消失,只留下动态的模糊画面,AI对于内容要点把握的还不好。当我尝试想让一张风景照无限扩展变成一张全景照片时。发现对于已经被扩展过的部分,Uncrop的扩展功能是不能继续套娃的。开源版SD-XL4月,Stability AI将Stable Diffusion XL开始面向公众测试。值得一提的是,开源的SD-XL就已经达到了Midjourney水平,能够图像细节等方面表现更好,几乎完全可控。关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。SD-XL相比之前版本的改进如下:使用较短的描述性prompt即可生成高质量图像可以生成更贴合prompt的图像图像中的人体结构更合理与 v2...
智能设备 2023-06-13 10:59:19 -
Instagram被曝将引入AI聊天机器人拥有30种人物性格
6月7日消息,Meta正在加速采用生成式人工智能技术,并将其整合到包括广告在内的各种平台上。现在,该公司正在Instagram上测试一项新功能...
互联网 2023-06-07 07:40:29 -
苹果宣布StandBy功能:让iPhone变身智能屏幕
IT之家 6 月 6 日消息,苹果在今天召开的 WWDC 2023 开幕演讲中,宣布了 StandBy 功能,iPhone 启用之后,可以充当智能屏幕(Smart Display),对于使用智能家居的用户来说是一项实用功能。苹果宣布将在今年秋季推出的 iOS 17 更新中,推出 StandBy 功能...
手机互联 2023-06-06 21:39:26 -
新款MacStudio将搭载M2Max和M2Ultra芯片
财联社6月6日电,苹果宣布,新款Mac Studio将搭载M2 Max和M2 Ultra芯片。苹果还推出搭载M2 Ultra芯片的MAC Pro...
业界动态 2023-06-06 01:23:53 -
中信科移动完成业界首次5GNTN标准的宽带卫星通信试验验证
6月3日消息,中信科移动在京宣布,中信科移动联合合作伙伴基于5G NTN的透明转发标准和全新的星地融合平台,通过高轨和低轨卫星,实现了业界首次5G NTN标准的端到端宽带卫星通信业务传输的技术试验验证。此次宽带业务测试性能符合预期、体验良好,同时实现了5G NTN卫星宽带业务和地面业务打通,支持语音、短消息、高清视频通话、4k高清视频播放、FTP下载等业务,从整个星地融合通信网络架构、标准协议、试验设备等方面全面验证了5G NTN技术落地能力,有效支撑未来手机直连卫星的实现,全面展现了在透明转发模式下高低轨卫星业务的高速率传输、高等级QoS业务保障能力,实现了5G NTN端到端全链路技术贯通...
电信通讯 2023-06-03 22:26:08 -
日本:敞开训练AI不用管版权,LeCun:机器学习天堂
西风 发自 凹非寺量子位 | 公众号 QbitAI大模型狂潮下,日本政府坐不住了。直接宣布:不会对训练AI所使用的数据实施版权保护。这也就意味着,训练AI可以使用任何数据。不管是非营利还是商业目的,不论是否是复制以外的行为,只要你能搞得到,你就可以用,甚至从非法网站获得的数据也可以用。连Yann LeCun看到消息后都发文表示:日本已经成为了机器学习的天堂。确实,不少日本学术界和商界人士那是敲锣打鼓。毕竟想要在全球大模型舞台上分得一杯羹,数据本就是一大关键要素。但这引起了动漫和艺术创作者的担忧。早在四个月前,日本参议院议员、职业漫画家赤松健在YouTube上发布了一个讲用AI进行图像生成的视频,就有提到过侵权问题,以及漫画师的担忧。在那时,就有日本画友认为:希望能开发出超越“Novel AI”的AI插图服务。当然,这个AI服务的训练数据集中不能使用未经授权的转载图片。但现在,对训练AI所使用的数据集的版权限制已放开。用无视版权的方式“弯道超车”其实,日本并不是第一次在版权保护上有所松懈。日本曾经因为过于严苛的版权保护,导致版权转让极为不便,需要遵循诸多条条框框,盗版问题也很严重。之后,日本在2019年修正了版权保护制度。即便如此,这次日本被爆在训练AI方面的大尺度政策,还是令人惊讶。Technomancers.ai报道称:似乎日本认为版权问题,尤其是与动漫和其它视觉媒体相关的版权问题,阻碍了该国在人工智能技术方面的进展。作为回应,日本决定全力以赴,选择无版权的方式来保持竞争力。尽管日本目前是世界第三大经济体,但自1990年代以来,日本的经济增长一直缓慢。此时,若人工智能可以得到有效发展,就有可能在短时间内将日本的GDP提高50%或者更多。对于日本来说,这是一个令人兴奋的前景。日本还试图把手伸向西方国家的数据库,这也是日本发展人工智能的关键。相较而言,日本的日语训练数据量明显少于西方可用的英语数据资源。日本拥有很受欢迎动漫等文化内容。在这点上,日本的立场似乎很明确:如果西方利用日本文化来训练AI,那么西方文化资源也应该可供日本训练AI。AI监管辩论还在继续TB级别的训练数据是维系大模型进化的一大核心要素。毕竟可用的高质量训练数据越多,AI 模型就越好。而关于大模型训练数据不透明等问题一直是大家讨论的热点。大模型的野蛮生长势必要带来人们对其安全合规的考量,侵权问题就是需要监管的问题之一。而此次日本这一举动也为监管辩论增添了转折。针对版权问题,美国版权局(USCO)在三月份也发布了新规。但并不是对版权进行保护,而是称:人工智能(AI)自动生成的作品不受版权法保护。因为,和人工参与创作的Photoshop作品不同,通过Midjourney、Stability AI、ChatGPT等平台生成的作品完全由AI自动完成,而且训练的数据是基于人类创作的作品,因此不受版权法保护。对此,你怎么看?参考链接:[1]https://technomancers...
智能设备 2023-06-03 10:08:55 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片
IT之家 5 月 31 日消息,摩托罗拉推出了其第三代 Moto G Stylus 5G 手机,是首批采用高通骁龙 6 Gen 1 芯片组的设备之一。该设备保留了位于充电端口旁边的标志性手写笔,但不支持三星 Galaxy S23 Ultra 的 S Pen 那样的蓝牙或压感功能。Moto G Stylus 5G (2023) 采用 6.6 英寸 FHD + 分辨率的 IPS LCD 屏幕,刷新率为 120Hz。屏幕上有一个小小的孔洞,用于放置 1600 万像素的前置摄像头。今年的 Moto G Stylus 在后面增加了一颗 5000 万像素的主摄像头(f / 1...
手机互联 2023-05-31 07:54:45 -
苹果的最大竞争对手?外媒上手Quest3头盔:预计10月份发布
5月29日消息,最近,彭博科技的作者马克·古尔曼(Mark Gurman)试用了Meta即将推出的混合现实头戴式设备Quest3。他认为,Quest 3更轻薄,透传功能大幅提升,处理速度更快,可运行的内容也更多,在混合现实领域明显具有很大吸引力...
业界动态 2023-05-29 16:28:37 -
北森发布iTalentX7.0平台:推出AI领导力教练Mr.Sen
【网易科技5月25日报道】今天,“HR SaaS第一股”北森在香港联交所上市后首次公开亮相,发布全新平台iTalentX7.0,推出“业人一体,为员工而设计”的价值主张,带来AI领导力教练Mr...
智能设备 2023-05-25 22:06:36 -
谷歌开源RustCrate审查结果:便于Rust开发者验证源码安全
IT之家 5 月 25 日消息,谷歌的许多开源项目都使用 Rust,这是一种现代系统语言,旨在构建可靠高效的软件。日前谷歌在 GitHub 上开源了对 Rust Crate 的审查结果,开发者可在自己的项目中导入这些审核结果,以证明所使用的 Rust Crate 的属性。▲图源 谷歌开源博客Rust 社区中存在可用于供开发者发布自己所开发的 Crate 的名为 Crates.io 的服务,开发者利用 Crates...
智能设备 2023-05-25 11:03:30