前哨速览:AI即将进入多模态时代,纳斯达克完成百亿收购,石油需求10年见顶
▲ 7周年限时优惠
产业
01
AI多模态时代,YouTube变成宝藏
随着OpenAI、谷歌都公布AI大模型的多模态能力,AI正在从文字交互扩展到视觉交互领域。
前沿开发者认为,这会让YouTube的数据价值被进一步放大。视频本质是连续图片播放的产物,加上与之匹配的音频、字幕文档,比普通的图片平台积累了更丰富多样的数据。
Google研究员已经在使用YouTube开发下一个大型语言模型:Gemini,谷歌CEO此前也表示新模型已经展示出了多模态能力。
一位知情人士称,OpenAI也意识到了YouTube的价值,正在秘密使用YouTube的数据训练人工智能模型。
02
未来10年石油需求即将见顶
国际能源署(IEA)预测,本世纪10年末全球石油需求将“即将见顶”。
他们认为清洁能源技术推广正在加速,电动汽车、能源效率等技术的普及将导致石油需求的减少。
预测认为,38个经济合作与发展组织成员国(包括澳大利亚、欧洲国家、日本、墨西哥和美国)石油需求将从2024年开始下降。
石油和天然气勘探、开采和生产的全球投资目前还将以每年15%的速度增长,到2023年将达到5280亿美元的最高水平。
企业
01
纳斯达克花百亿收购企业
02
亚马逊考虑采用AMD芯片训练AI
路透社独家报道:亚马逊云计算部门正在考虑使用AMD的新人工智能芯片。
目前,AI大模型训练用GPU基本被英伟达垄断,AMD近期公布了相似的AI加速计算芯片MI300,瞄准正在扩大的AI大模型算力需求。
据内部消息,亚马逊拒绝采用英伟达芯片方案,主要是出于成本考虑,希望能够自主设计服务器架构,而不是接受英伟达的通用方案。
这一决策尚未正式作出。
03
又一家自动驾驶企业SPAC上市
汽车软件制造商LeddarTech与Prospector达成SPAC合并协议,将以3.48亿美元估值在纳斯达克上市。
该交易将为LeddarTech提供6600万美元的资金,帮助其实现首批嵌入式自动驾驶解决方案商业化。交易预计在今年第四季度完成。
LeddarTech成立于2007年,是一家为自动驾驶汽车和先进驾驶辅助系统开发环境感知解决方案的公司,已申请150项专利并获得80项。
04
谷歌将AI合成技术用到在线购物
谷歌正在将生成式人工智能融入在线购物功能,帮助人们直观了解服装与自己是否搭配。
此外,谷歌还推出了新的旅游目的地和地图路线AI规划方案,预计6月推出。
技术
01
AI新算法不但能读唇语,还能还原声音
近期,研究人员开发了一种新的Lip2Speech合成模型(唇语到语音),可以根据没有声音的人物视频生成匹配的声音。
该算法经测试,产生的合成语音与说话人的嘴唇动作、年龄、性别和整体外貌相匹配。
自动化 Lip2Speech 合成可用于许多用例,例如帮助无法产生语音的患者与他人交流,为无声电影添加声音,在嘈杂或损坏的视频中恢复语音,甚至用于确定潜在犯罪分子在无声闭路电视录像中所说的话。
我们还整理了一份“Apple Vision Pro及主流VR头显参数对比”,辛苦你点下“赞”和“在看”,点击顶部的“进入公众号”,在对话框里发送“科技”二字,你就会获得这份清单。
【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!
【回放地址】
长按图片识别二维码报名加入,可观看所有直播和回放。
微信扫码关注该文公众号作者