库克称苹果今年引入生成式AI;文心一言数字分身功能内测;商汤大模型体系日日新4.0发布丨AIGC大事日报科技2024-02-02 11:0202 / 02全球AIGC产业要闻1、百度文心一言内测数字分身功能2、商汤发布日日新SenseNova 4.03、谷歌Bard、搜索引擎新增文生图功能4、谷歌Gemini Pro扩展至中文等46种语言5、谷歌地图引入生成式AI功能6、亚马逊推出对话式AI购物助手Rufus7、库克:苹果将在今年晚些时候推出生成式AI功能8、阿里发布手机操作智能体框架Mobile-Agent9、巨人网络游戏大模型GiantGPT完成备案10、网安局通报AI生成造谣文章案11、万事达推出欺诈检测AI大模型12、AI基础设施创企Astera Labs计划3月IPO13、研究表明AI可以从婴儿视角学习语言1、百度文心一言内测数字分身功能据百度微信公众号发文,文心一言APP正在内测数字分身新功能,今日起,iOS和安卓用户可升级新版本免费试用。基于该功能,用户只需一张照片、录制三句语音,即可创建专属数字分身,并且支持个性化定义名称、声音、MBTI性格等,用户可选择是否公开自己的数字分身。2、商汤发布日日新SenseNova 4.0据商汤科技微信公众号发文,今日,商汤大模型体系日日新SenseNova 4.0发布,其知识覆盖面、推理能力、长文本理解力、代码生成能力等得到提升。其中,日日新·商量大语言模型-通用版本(SenseChat V4)支持128K语境窗口长度,综合整体评测成绩水平比肩GPT-4,相较GPT-3.5已经实现全⾯超越。商汤还推出了支持不同模态工具调用的日日新·商量大语言模型Function call & Assistants API版本,降低开发者使用大模型的门槛。API申请网址:https://platform.sensenova.cn/3、谷歌Bard、搜索引擎新增文生图功能今日,谷歌宣布在聊天机器人Bard中推出由Imagen 2模型支持的文生图功能。同时,谷歌推出新的文生图工具ImageFX,支持用户使用简单的文本提示创建图像,并提供新的提示修改建议。此外谷歌搜索和机器学习平台Vertex AI也将提供Imagen 2驱动的图像生成功能。4、谷歌Gemini Pro扩展至中文等46种语言今日,谷歌宣布聊天机器人Bard中的Gemini Pro模型将扩展至46种语言和238个国家/地区,其中包括简体/繁体中文。5、谷歌地图引入生成式AI功能今日,谷歌宣布在谷歌地图中引入生成式AI功能,利用大模型分析地图上超过2.5亿个地点的详细信息及超过3亿贡献者的社区意见,为用户提供寻找的内容或目的地建议,该功能本周起在美国推出。6、亚马逊推出对话式AI购物助手Rufus今日,亚马逊于官网发布对话式AI购物助手Rufus,目前向一小部分客户推出测试版,未来几周将扩展至更多美国用户。Rufus经过亚马逊的产品目录、用户评论、社区回答和网络信息的训练,可以回答用户关于购物需求和产品的问题,提供购买建议等。7、库克:苹果将在今年晚些时候推出生成式AI功能今日,苹果CEO库克在财报电话会议上称,公司正在开发生成式AI软件功能,这些功能将在“今年晚些时候”向客户提供,“我认为苹果在生成式AI和AI方面存在着巨大的机会,但我不想谈更多细节。”8、阿里发布手机操作智能体框架Mobile-Agent1月30日,来自阿里和北京交通大学的团队在arXiv上发表论文,提出了用于操作手机的智能体框架Mobile-Agent。据介绍,这是一个纯视觉解决方案,不需要XML(可拓展标记语言)和系统元数据,其操作范围不受限制,可进行多应用操作,配备多种视觉感知工具用于操作定位,且无需训练,即插即用。目前,Mobile-Agent已经学会了阿里巴巴、谷歌地图、TikTok等10个APP的操作,可以完成一些跨应用任务。GitHub主页:https://github.com/X-PLUG/MobilAgent论文地址:https://arxiv.org/abs/2401.161589、巨人网络游戏大模型GiantGPT完成备案据游戏公司巨人网络微信公众号发文,巨人网络正式完成游戏AI大模型GiantGPT的备案,成为游戏行业首家对外确认实现了此成果的企业,相关备案结果今日在上海正式公布。即日起,巨人网络AI大模型GiantGPT的有关服务可以正式开展业务。据介绍,GiantGPT是专注于游戏业务的垂类大模型,结合巨人网络自有数据与互联网公共数据训练,并针对角色演绎、情景推理与长期记忆等基础能力进行优化。10、网安局通报AI生成造谣文章案2月1日,公安部网安局通报了一起利用AI发表造谣文章赚取佣金案件。网民王某在某APP上参加发布作品赚取佣金活动,因写作水平有限,便依托某款手机软件的AI题词功能写文章。王某在系统中输入带有“杀人、失踪”等敏感字眼的提示词,附以时间地点,就能自动生成博取眼球的文章。其利用AI编造的文字不仅骇人听闻,而且很多地方还“明确”了事件发生的时间、地点,误导读者以为这些事就发生在本地,信息被大量网民点赞、留言、转发,严重干扰社会秩序。目前,齐齐哈尔公安机关对王某处以罚款,同时责令删除相关谣言。11、万事达推出欺诈检测AI大模型据CNBC今日报道,支付巨头万事达称其已经建立了自研的生成式AI大模型Decision Intelligence Pro,以帮助银行实时评估其网络上的可疑交易,确定它们是否合法,从而检测并根除欺诈交易。据称,该模型基于Transformer从头开始构建,利用万事达生态系统中的数据进行训练,重点在于使AI理解“商家之间的关系”,而不是关注单词和文本。万事达网络和情报业务部门总裁Ajay Bhalla称,该模型进行欺诈检测的过程仅需50毫秒,可以帮助金融机构将欺诈检测率平均提高20%,在某些情况下最高能提高300%。12、AI基础设施创企Astera Labs计划3月IPO据外媒The Information今日报道,知情人士称,英特尔支持的美国云计算与AI基础设施创企Astera Labs一直在与潜在的投资者会面,计划在3月由摩根士丹利和摩根大通牵头进行IPO(首次公开募股),最早可能在本月公开招股书。据透露,Astera Labs今年预计产生2.5亿至3亿美元收入。该公司从2023年实现盈利,截至10月有200多名员工。2022年,Astera Labs的估值为31.5亿美元。根据与其类似的上市公司Credo Technology的估值,其现在的估值可能达40亿美元。13、研究表明AI可以从婴儿视角学习语言今日,来自纽约大学的团队在《科学》(Science)杂志发表论文,展示如何让AI模型从一个婴儿的角度去学习。研究团队在头戴摄像头视频上训练了一个神经网络CVCL,该网络捕获了来自澳大利亚的婴儿Sam从6个月到25个月大所看见的片段,他每周佩戴摄像机2小时,约占其清醒时间的1%左右。研究团队根据Sam的视频建立了SAYCam-S数据集,从中选取了61个小时的录像,包括60万张视频帧和3.75万段经过转写的录音,记录了大约25万个单词实例以及对应的图像。研究发现,即使数据有限,AI模型也能从数十个到数百个示例中获取单词到视觉之间的映射,而且能够将零样本泛化到新的视觉数据集,并实现多模态对齐。论文地址:https://www.science.org/doi/10.1126/science.adi1374微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章