如何让企业把大模型用起来？零一万物的答案是 API 开放平台

2024-03-28 02:03

作者｜周一笑
邮箱｜[email protected]

大模型的诞生标志着人工智能领域中的一个重大进展，它不仅推动了技术和研究的新方向，也为各行各业带来了深远的影响。2023 年，我们见证了“百模大战”，2024 年，我们期待着 AI 2.0 应用的爆发，如果说 To C 市场还在等待一个属于 AI 2.0 Killer App，在降本增效成为主流趋势的今天，To B 市场便成为了 AI 2.0 落地的最佳试验场之一。

随着企业和开发者对 AI 2.0需求的增加，API 平台作为连接开发者和 AI 服务提供者的桥梁，成为AI生态中不可或缺的一部分。API 平台使得开发者能够轻松接入和使用大模型的能力，而无需从头开始构建复杂的 AI 2.0产品和系统。

近日，大模型公司零一万物发布了 Yi 大模型 API 开放平台。所有企业和开发者都可以通过 API 便捷高效地体验 Yi 大模型的能力。

此次 API 开放平台提供了三个 Yi 系列模型：

Yi-34B-Chat-0205：支持通用聊天、问答、对话、写作、翻译等功能。

Yi-34B-Chat-200K：200K 上下文，多文档阅读理解、超长知识库构建小能手。

Yi-VL-Plus: 多模态模型，支持文本、视觉多模态输入，中文图表体验超过 GPT-4V。

零一万物 API 开放平台链接：https://platform.lingyiwanwu.com/

零一万物是由李开复博士所领导的 AI 2.0 公司。致力于打造中国领先的大模型技术团队，并攻克基础大模型和 AI 2.0 核心技术难题，已发布了 Yi 系列开源大模型，在斯坦福、伯克利等权威评测榜单中表现优异，性能直追GPT-4。目前，Yi 大模型已经实现了 200K上下文（可处理约30万中英文字符）的长文本推理，以及支持多种应用场景的多模态模型。

长文本支持30万字汉字，多模态中文图表体验超GPT-4V

目前国内各家大模型都在强调长文本能力，零一万物也将对长文本能力的拓展作为 API 平台更新的重点，并且直接将此能力通过 API 提供给广大的开发者及企业，这不仅提高人机交互的自然性和流畅性至关重要，还能进一步提升 AI 应用应对复杂场景的能力。

其中 Yi-34B-Chat-200K 拥有 200K 上下文窗口，支持输入 30 万汉字（相当于可以一次处理整本《三体1》），读整本小说、科研论文、行业报告都不在话下。API标配长文本能力，可以极大推动 AI 2.0应用在金融、司法、科研等诸多 B 端场景的落地。

此外，值得一提的是，在“大海捞针”的测评中，Yi-34B-Chat-200K 的性能从 89.3% 提升到 99.8%，接近满分。

“大海捞针”测试通过将一个目标句子（作为搜索的“针”）放入一个庞大的随机文档语料库（相当于“大海”）中，然后向模型提出一个问题，这个问题的答案只能通过理解并回忆目标句子中的信息来找到。这意味着 Yi-34B-Chat-200K 在理解、记忆和检索方面的能力得到了极大的增强，这对于开发改善知识管理系统、提高自动问答系统的准确性等应用都非常有价值。

《科学怪人》（Frankenstein）被认为是科幻小说的先驱之一，小说中探讨了许多深刻的主题，主要的故事线围绕着弗兰肯斯坦和他所创造的“怪物”之间的关系展开，同时也探讨了弗兰肯斯坦与他的家人、朋友以及其他人物之间的关系。

在实际测试中，Yi-34B-Chat-200K 不仅可以很快读完近300页原版的《科学怪人》，还能清晰的梳理出小说中错综复杂的人物关系，这体现了 Yi 模型在处理超长上下文时出色的复杂内容理解和分析能力

此次零一万物 API 平台的另一亮点是提供了多模态模型 Yi-VL-Plus，支持文本、视觉多模态输入，并面向实际应用场景大幅增强了相关能力：

增强Charts, Table, Inforgraphics, Screenshot 识别能力，支持复杂图表理解、信息提取、问答以及推理。其中中文图表体验超过 GPT-4V。
在 Yi-VL基础上进一步提高了图片分辨率，模型支持 1024*1024 分辨率输入，显著提高生产力场景中的文字、数字 OCR 的准确性。
保持了 LLM 通用语言、知识、推理、指令跟随等能力。

Yi-VL-Plus 对图表、表格、信息图形和截图等视觉内容识别和理解能力的增强，提升了其从复杂的视觉资料中快速提取关键信息、大幅提高数据分析和处理的效率和准确性，这对于 B 端场景下的生产力应用至关重要。

在中文图标场景下，Yi-VL-Plus 的体验超过了 GPT-4V，在实测中，当我们把同一表格分别交给Yi-VL-Plus 和 ChatGPT 处理，Yi-VL-Plus 的准确率超过了 ChatGPT：

将图表转换为 Markdown 格式的案例中，Yi-VL-Plus 的体验同样超过了 GPT-4V。

多模态能力是大模型发展的关键方向之一，Yi-VL-Plus 的多模态能力不仅提升了模型的性能和应用范围，也为 AI 2.0技术在各个行业的深度融合和创新应用提供了强有力的支持。Yi-VL-Plus 在中文图表体验超过 GPT-4V，这体现了零一万物充分利用中文语言数据的优势，具有更好的本土化特性和适应性，对于想要开发 AI 应用的本土企业和开发者来说也更加友好、易用。

AI 2.0 重构一切，B 端先行落地

此前，零一万物已经启动了 Yi-34B-Chat-0205 和 Yi-34B-Chat-200K 两个模型的邀测，不少开发者和企业已经借助 Yi 大模型 API，实现 B 端和 C 端的各类应用场景落地，包括类 ChatGPT 的对话助手，将 Yi 模型整合现有产品，实现 Copilot 工具，以及借助 Yi 超长上下文模型构建知识库问答，用于客服、培训等特定知识的问答场景等等，而其带来的业务增量或者降本增效已在不少公司有所体现。

星云爱店是一家互联网和 AI 创业公司，公司的业务包含 2C 的“学术科研助手”，2B 的儿童心理健康诊疗、青少年科学素养培养三大领域。

星云爱店的产品基于大语言模型，例如，在科研学术场景通过大模型帮助用户进行深层次文本资料解读、文献分析以及创造性写作。针对儿童心理健康，提供诊前智能量表，虚拟疗愈空间和诊后个性化关怀。针对青少年科学素养培育计划，利用大模型来辅助制定个性化学习计划，提供学习辅导，评估学习成果，提升学习效果。

不同的业务方向，对大模型提出了不同的要求。因此，找到合适的大模型作为业务可持续发展的底座至关重要。

在科研和心理咨询等场景，在线拒答率，回答的同理心程度也极大影响用户体验。星云爱店 CTO 大董测试过诸多一线大模型，他表示找到兼具 IQ 和 EQ 的平台并不容易。在接入零一万物的 API 之后，“不像某些大模型API接入后，动不动就拒答或者回答文本‘降智偷懒’，Yi大模型IQ在线且EQ出色，测试期间几乎没有拒答，能持续输出高质量有温度的文案，我们相当满意。”

在涉及专业知识学习与解读的案例中，Yi-VL-Plus 给出较为准确的回答。借助 Yi-VL-Plus 的多模态能力，能够结合历史病历和图片信息（脱敏数据），较好地完成对青少年心理健康水平解读。

一个在文献综述的应用中，面对复杂任务（涉及找关联、打分、测距、翻译），其他大模型出现了拒绝的情况，而再切换到 Yi 大模型之后，任务顺利执行。

深圳市超思维智能是一家生成式 AI方向的创业公司，其技术负责人近期在测试通过大模型进行知识库的挂载，他们通过接入零一万物的 API，使用 Yi-34B-Chat-200K 完成了知识库挂载的操作，大量学术文档和知识资料得以高效整合，形成了一个动态更新的知识库。利用模型的长文本输入、输出和总结以及关键信息提取的能力，不仅能够高效地整合和管理大量的信息资源，还提升了信息检索的准确性和速度，成为超思维智能多模态开发中的一部分功能。

在实测中，Yi-34B-Chat-200K 完成了对中英文混合表格文档的信息筛选、内容总结，为多语言环境下的文档管理和知识提取提供了新的解决方案。这对于需要管理和分析大量复杂数据的企业和组织来说，是一个极具价值的资源。

专业性学术文档的内容总结提取也能做到高效、准确。

不仅能高效处理和总结文档内部小标题下的详细内容，还能准确识别 PDF 中图片文字信息。通过这种方式，Yi-34B-Chat-200K 可以实现对文档内容的全面把握，包括那些以较为复杂形式呈现的信息，如图表、插图中的文字描述。这一能力特别对于需要处理大量包含图文混排信息的文档非常有用，比如研究报告、技术手册等。

除了 B 端的应用，在 C 端我们同样看到了有趣的案例，闻（网名门耳朵）做 Hifi 音响生意，热心普及古典音乐，同时也是 AI 大模型发烧友，在 Yi 推出200K的 API 后，闻申请了试用，希望借助 Yi 的大模型实现对长文本的翻译。

闻想要翻译的文本是古典专辑小册子，冷门且专业性很高，借助 Yi 大模型的 API，闻也实现了自己的翻译应用，成功翻译了古典音乐文本，并借助大模型改写为相关的科普文本，最终得到了可以发布在自己公众号上的文章。

闻尝试过市面上的各种大模型和 API，他表示去年想做到这件事情，还只有GPT有较长的接口，能够达到差强人意的效果，但一次性翻译依然不够好。

此前在音乐翻译的流程中，他会三次利用到大模型。第一次是将原文翻译成中文，第二次是提供原文和翻译后的进行校对，第三次是把文章改写成浅显易懂的音乐科普文章，三次可以调用不同的模型接口。而有了 Yi-34B-Chat-200K 的 API 之后，原来的三个步骤可以合并为一步进行。

闻表示，要翻译这种材料除了翻译的能力，也需要比较强的音乐专业的背景，而 Yi 的“长文本能力绝对是非常牛逼的”，借助一些格式规范化的手段，可以完成很好的翻译。

兼容 OpenAI API，更强模型在路上

大模型行业日新月异的今天，企业和个人开发者都在思考如何让 AI 应用真正落地，并能面向市场和用户交付。这不仅需要要大模型基础能力的提升，也需要相关工具链及生态的完善和成熟。零一万物此次发布 Yi 大模型 API 开放平台，也是意在进一步搭建基于 Yi 开源大模型的生态系统，从而促进 AI 应用的普及和发展，随着更多企业和开发者使用零一万物官方 API，我们可以预见更多“AI-First”应用将会出现。

目前 Yi 大模型 API 开放平台推出了上新优惠活动，新用户注册即送 60 元（千万级 token），可以在官网了解详情，零一万物 API 开放平台：https://platform.lingyiwanwu.com/

另外，Yi Model API 与 OpenAI API 是完全兼容的，进一步移除了迁移的技术成本，只需修改少量代码，即可完成平滑迁移。