8、新研究为Gemini正名:推理能力不输GPT-3.510、华为盘古-π架构发布 同规模推理快过Llama 212、MiAO提出AI角色扮演新框架:让游戏NPC更拟真13、AI发现拉斐尔名画秘密:有张脸不是拉斐尔画的
调研机构WriterBuddy近日发布一项新调查,通过使用SEO行业知名工具SEMrush研究3000多种AI工具,其筛选出2022年9月至2023年8月访问量最大的50款工具,这些AI工具吸引了超过240亿次访问量。其中,ChatGPT以140亿次访问量位居第一, 占分析流量的60%以上。AI聊天机器人类工具最受欢迎,访问量达到191亿次。这50款全球访问量最高的AI工具的增长率为10.7倍,平均每月访问次数增幅为2.363亿次。ChatGPT、Character AI、谷歌Bard净流量访问次数分别增长了18亿次、4.634亿次、6800万次。Craiyon、Midjourney、Quillbot同期面临最大的流量降幅。据美图微信公众号发文,今日,美图公司自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。在当前通过备案的国内大模型当中,MiracleVision是唯一专注视觉领域的大模型,也是福建省唯一通过备案的大模型。美图AI视觉大模型MiracleVision于2023年6月内测,为美图秀秀、美颜相机、Wink、美图设计室、WHEE、美图云修等影像与设计产品提供AI模型能力,同时帮助美图公司搭建起由底层、中间层和应用层构建的人工智能产品生态。目前该模型已升级至4.0版本,除全面应用于美图旗下产品,还在逐步助力电商、广告、游戏、动漫、影视五大行业。同花顺微信公众号今日发文宣布,同花顺问财HithinkGPT大模型的内测申请已经启动。其投顾对话机器人同花顺问财,现基于HithinkGPT成功升级,是国内金融领域首个应用大模型技术的智能投顾产品。问财HithinkGPT大模型采用transformer的decoder-only架构,提供7B、13B、30B、70B和130B五种版本选择,最大允许32k文本输入,支持API接口调用、网页嵌入、共建、私有化部署等能力,并为用户提供一站式标注和评测服务。受益于生成式AI热潮,AI芯片主要供应商英伟达股价在2023年一路走高。连带着英伟达创始人兼CEO黄仁勋的身价水涨船高,在2023年增加302亿美元,从去年1月1日的138亿美元上涨至440亿美元,成为2023年收入最高的企业家之一,排名彭博亿万富豪榜第29位。据《朝鲜日报》12月26日报道,存储芯片大厂美光科技和SK海力士已经分别从英伟达获得了7000亿~1万亿韩元的HBM3预付款,用于供应先进内存产品。尽管有关预付款的性质、产品和合同细节的细节尚未披露,但它被解释为确保HBM3E(第5代)产品的供应,该产品将与GPU产品搭配使用。此外,三星电子据称近期已与英伟达完成产品适用性测试,并签署了HBM产品供应合同。据The Information 12月30日援引两位知情人士的话报道,受益于ChatGPT强劲增长,OpenAI最近的年化收入超过了16亿美元,高于10月中旬预期的13亿美元。最新的年化收入数据表明,OpenAI每月至少从ChatGPT的订阅销售和软件开发者通过API访问其模型中获得1.3亿美元的收入。OpenAI的一些领导层认为,到2024年底,OpenAI的年化收入可达到50亿美元,另一些人则认为这个数字要更高。美国加州大学研究团队12月26日在arXiv平台上发表一篇新论文,发现利用GPT-3系列模型和其他几个最近开源的大语言模型并控制数据集难度,在大语言模型训练数据创建日期之前发布的数据集上,大语言模型的表现出乎意料地好于之后发布的数据集。这表明对于许多大语言模型来说,在大语言模型的训练数据创建日期之前发布的数据集,存在零样本和少样本评估上的任务污染。任务污染可能是影响大语言模型泛化能力的原因之一。研究团队还利用训练数据检查、任务示例提取和成员推理攻击来揭示任务污染的进一步证据,发现对于没有任务污染可能性的分类任务,无论是零样本还是少样本设置,大语言模型很少表现出相较简单大多数基线具有统计学上的显著改进。论文地址:https://arxiv.org/abs/2312.163378、新研究为Gemini正名:推理能力不输GPT-3.5来自斯坦福大学和Meta的研究人员12月29日在arXiv平台上发表一篇新论文,其初步基准测试表明,Gemini在常识推理任务中落后于GPT模型,但这种基于有限数据集的评估并不能完全捕捉Gemini真实的常识性推理潜力。通过对Gemini在复杂推理任务(这些任务需要跨模态的常识知识整合)中的表现进行了全面评估,对12个常识性推理数据集进行全面分析,其实验证明了Gemini具有竞争力的常识推理能力。根据实验结果,Gemini Pro的平均准确率与GPT-3.5 Turbo相当,低于GPT-4 Turbo。论文地址:https://arxiv.org/abs/2312.17661来自美国得克萨斯大学奥斯汀分校和Meta生成式AI团队的研究人员12月29日在arXiv平台上发表一篇论文,提出了一个一致的视频生成视频(V2V)合成框架FlowVid,通过利用空间条件和源视频中的时间光流信息,实现了合成的高度一致性。给定输入视频和文本提示词,FlowVid就能合成时间一致的视频。根据论文,V2V模型FlowVid具有高灵活性、高效率、高质量等优势,生成一段30 FPS、512 × 512分辨率的4秒视频仅需1.5分钟。论文地址:https://arxiv.org/abs/2312.1768110、华为盘古-π架构发布 同规模推理快过Llama 2华为2012实验室等团队12月27日在arXiv平台上发表一篇论文,提出了一种新型高效现代模型架构盘古-π,来解决特征坍塌问题。实验结果表明,与Llama 2等最先进的大语言模型相比,PanGu-π-7B在推理速度提升10%左右的情况下,可达到与基准相当的性能;PanGu-π-1B在精度和效率方面都能达到最先进的性能。此外,研究团队将盘古π- 7B应用于金融、法律等领域,开发出实用型大语言模型云山。结果表明,云山大模型在基准测试上可超越其他类似规模的模型。论文地址:http://arxiv.org/abs/2312.17276来自腾讯平台与内容事业群(PCG)、浙江大学、上海科技大学的团队12月31日在arXiv平台上发表一篇论文,提出了一个从粗到精的生成式框架Paint3D,能够为文本或图像输入条件下的无纹理3D模型生成高分辨率、无光照和多样化的2K UV纹理映射,显著提高了3D物体纹理化的水平。这项研究解决的关键挑战是在没有嵌入式照明信息的情况下生成高质量的纹理,使得纹理可在渲染管道中被重新照明或重新编辑。项目地址:https://github.com/OpenTexture/Paint3D
论文地址:https://arxiv.org/abs/2312.1391312、MiAO提出AI角色扮演新框架:让游戏NPC更拟真国内游戏和社交平台初创企业MiAO于12月24日在arXiv平台上发表一篇论文,提出了一种角色扮演语言智能体框架LARP,旨在弥合语言智能体和开放世界游戏之间的差距。LARP框架细化了用户和智能体之间的交互,预定义了独特的背景和个性,能够增强开放世界背景下的游戏体验。MiAO由前巨人网络CEO吴萌创办,今年3月获得亿元级天使轮投资,投资方包括红杉中国、高榕资本、砺思资本等。项目地址:https://miao-ai-lab.github.io/LARP/
论文地址:https://arxiv.org/pdf/2312.17653.pdf13、AI发现拉斐尔名画秘密:有张脸不是拉斐尔画的来自多所英美高校的研究团队训练了一款定制AI算法,该算法发现意大利著名画家拉斐尔的名画《玫瑰圣母》中有一副面孔并非出自拉斐尔之手。其机器学习方法使用拉斐尔著名和真实画作的测试集进行验证时,在图像分类任务中显示了98%的准确率。相关论文已于12月21日发表于《遗产科学》期刊。论文地址:
https://heritagesciencejournal.springeropen.com/counter/pdf/10.1186/s40494-023-01094-0.pdf360集团创始人、董事长周鸿祎12月31日发微博宣布,其数字发言人“数字老周”正式上线,并公布了一份年度报告。12月29日,对话式搜索引擎创企Perplexity AI的CEO Aravind Srinivas在社交平台X上公开回应有关竞争不过搜索引擎大厂谷歌的质疑,称Perplexity存在的原因是通过更少的关键字查询、筛选、链接点击、页面浏览,提高搜索效率和信息访问效率;直接找到问题根源,然后用一个简洁、清晰、个性化的答案,便于人们做出决定,这与谷歌的财务和商业目标是不一致的。(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)