Redian新闻
>
“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

“火山方舟”MaaS 平台亮相:集成七款大模型,抖音等业务团队已试用

公众号新闻

作者 | 褚杏娟

6 月 28 日,火山引擎发布了大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即 Model-as-a-Service)。据悉,目前“火山方舟”集成了百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI(以拼音首字母排序)等多家 AI 科技公司及科研院所的大模型,并已启动邀测。

对于中国的大模型发展,火山引擎有下面几个关键判断:

第一,未来的大模型 市场将是一个百花齐放的多模型生态。由于安全信任、行业壁垒和成本等因素,这个生态将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型。同时,开放的市场竞争和模型多样性又会进一步促进整个技术发展。

第二,企业,尤其是行业头部企业,自身对于大模型的应用,将是“1 + N”的应用模式,即:企业通过自研或者与三方模型服务商的深度合作,形成企业自身的一个主力模型;在这个主力模型之外的不同场景中,企业还会同时应用 N 个外部模型。

基于以上判断,火山引擎定位于为模型生产端和模型应用端提供底层能力和产品方案,解决计算、安全、成本等通用问题。据悉,火山方舟由以下几个核心部分构成:

第一个是模型广场,许多模型提供商会提供不同版本 / 不同尺寸的模型。企业可以直接与这些模型交互。在火山引擎上可以直接调用推理 API,接入生产环境。适合进行快速分析和 AB 实验。

第二个是模型评估。企业要把大模型用好,首先得想好自己的业务需求,并为之设计一套可量化的评估指标,并在不断对比 / 评估 / 试验的过程中,积累评估数据、快速迭代。要给多样化的业务场景和业务入口,挑选不同的、最合适的模型。

第三个是模型精调。对于要求较高的垂直场景,用户可能需要利用自有数据和领域非公开数据,进行持续训练,并且建设和积累自己的精调数据集。对精调的良好运用也有益于对更小尺寸模型的利用, 在特定工作上达到逼近通用大模型的水平,由此降低推理成本。火山方舟可以对一个模型或多个基座模型同时发起训练任务,同时实时跟踪模型精调的效果指标和运行情况。

第四个是安全和信任机制。据悉,火山大模型服务平台提供了基于安全沙箱、硬件加密和联邦学习的多套大模型安全与信任解决方案。吴迪表示,“火山方舟”还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案。

随着平台不断迭代, 企业对大模型的资源供应将更为弹性 / 动态和廉价。火山引擎通过流量错峰、训推一体等手段,将进一步降低推理的单位成本。吴迪表示,这也是在大模型时代,上云所带来的重要优势。除此之外, 火山引擎将和大模型提供商联合进行深度的性能优化,包括火山引擎知名的 veLego 优化框架,还包括火山引擎将不断和大模型提供商分享 / 共创的诸多量化 /batching/ 调度等优化技术。

火山引擎总裁谭待 认为,除了算法、数据和算力外,企业做大模型还需要考虑以下问题:

  • 全与信任。这里的安全和信任是一种双向信任。大模型服务商除了考虑模型方案和代码不被泄露,也需要考虑到各个应用企业的安全问题,保障企业在调用大模型时自己的 prompt 或精调数据不会被泄露。

  • 性价比。之前大家处于模型研发的早期,更多考虑的是模型预训练阶段的成本问题,但后期模型的推理计算才是成本更高的环节。只有推理成本做到足够低,才能让大模型真正被广泛使用。

  • 生态系统。生成式模型并不知道自己擅长什么、不擅长什么,需要我们告诉他们自己的优劣势,并且在他们不擅长的地方为其提供下游的模型、API 和插件,帮助他们更好地解决问题,帮助大模型“长出手和脚”。

火山引擎智能算法负责人吴迪表示,与其他很多云厂商单纯提供算力、基础底座不同,火山方舟平台一方面会在资源和优化方面跟模型提供商进行非常深度的合作,长期致力于降低推理成本,另一方面,火山算法团队会和客户做重点的应用共建和应用落地,催化整个大模型、大算力在千行百业的落地速度。

据悉,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索,利用大模型能力促进降本增效。这些内部实践也在快速打磨“火山方舟”,推动平台能力的进一步完善。“火山方舟”的首批邀测企业还包括金融、汽车、消费等众多行业的客户。

谭待坦言,“火山方舟”还在起步阶段,工具链和下游应用插件需要持续完善,平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

一场马斯克的反爬闹剧:Twitter一夜回到五年前?

对话开源泰斗陆首群教授:中国开源发展应追求0到1的爆发性创新,而不是0到0的假创新

离职员工窃取源代码,半年狂赚1.5 亿;美团“1元现金”火速收购光年之外;53岁周鸿祎清华读博:重新学习做一个工程师|Q 资讯

对话用友王文京,探寻企业数智化的“密钥”

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百度智能云:千帆大模型平台接入Llama2等33个模型,推理成本可降低50%国家地理“影像方舟”口碑新作上线,值得每个家庭珍藏的动物博物馆!后院鱼池轶事只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型退休生活杂记:晨景、洗牙保健、跑20英里爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯如何打造数字化业务团队?这是我们给企业的一些建议两首合唱:《赤伶》&《是否》智讯|理想汽车二季度毛利率超特斯拉;地平线智能驾驶研发总监加入比亚迪;广汽 AI 大模型平台亮相引入33个大模型,百度智能云千帆大模型平台的“破茧时刻”大模型,抖音快手终于来了达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力火山引擎推出大模型平台;云知声提交上市申请;联通推出首个运营商大模型丨AIGC大事日报一份工作5个试用期?试用不能成为“白用”市值暴涨至万亿美元后,英伟达再放大招!推出超级AI计算平台:集成256个GH200芯片、共享内存144TB谷歌将推新版大模型;抖音发布AIGC平台规范;宇视推出行业大模型 | AIGC日报梅根是你嘛?网传她装扮成七旬老头混进查尔斯加冕礼!结局哭笑不得…阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报市值暴涨至万亿美元后,英伟达再放大招!推出超级 AI 计算平台:集成 256 个 GH200 芯片、共享内存 144TB百集视频专题《大话集成电路》第三章:集成电路的基础工艺现场办公!驻温哥华总领馆将去两城市受理护照、养老金审核等业务等不来自家大模型,火山引擎先搭了一个模型​「货架」|最前线接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级AI版Office定价昂贵,微软“劈腿”Meta推大模型,免费且开源!追剧 《听说你喜欢我》火山引擎发布“火山方舟”;微信广告上线看一看焦点卡片广告;美特斯邦威以3亿元出售房产自救……28小时高速航行!同胞海上受伤,“和平方舟”来了火山的“方舟”驶入大模型微软AI全宇宙开启:集成Windows、推出AI应用商店、Bing接入ChatGPT柳士同诗稿中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报引领手机向“全知全能”进化!iOS版ChatGPT推出联网模式:集成Bing搜索功能,仅对付费用户开放
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。