星环科技入局 AIGC!发布“无涯”“求索”两款大模型
以 ChatGPT 为代表的超大语言模型的迅速应用,加速了 AI 普及,让 AI 伸手可及,并开始走进大众的工作和生活。毫无疑问,AI 大模型等技术已经深刻地影响到所有行业的发展,并正在重构企业核心产品,重塑用户与企业产品和服务的交互方式。
5 月 26 日,星环科技在“向星力·未来数据技术峰会(FDTC)”上发布了金融大模型“无涯”和大数据分析大模型 SoLar“求索”。
“无涯”是一款面向金融量化领域、超大规模参数量的生成式大语言模型。无涯使用上百万的专业金融语料,其中涵盖了研报、公告、政策、新闻等高质量的自然语言文本来作为基础大模型的二次预训练语料,使得“无涯”具备对包括基本面、技术面、消息面在内的金融通识领域准确的理解能力。
无涯构建了包括政策、舆情、ESG、风险、量价、产业链等六类大模型基础因子集,擅长处理金融量化领域的各类问题,诸如在政策和研报分析、新闻解读、事件总结和演绎推理上都具备强大的理解和生成能力;能够对股票、债券、基金、商品等各类市场事件进行全面的复盘、传播和推演;能够生成另类的策略因子集合,构建立体的归因解释体系。“无涯”大模型通过多模感知 + 事件驱动 + 深度图计算,从时间和空间、深度和广度等多个方面扩展了投资研究的视角。
SoLar“求索”大模型将作为数据查询和分析的智能助手,为数据工程师、数据科学及业务人员提供更好的使用体验,让非专业用户在不需要学习和掌握数据库编程语言的前提下,就可以通过自然语言自由地按需查询数据。
星环科技创始人、CEO 孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及, 每个人都将需要一个“虚拟业务助手”。
ChatGPT 主导的对话式 AI 开始渗透到各行各业,使人和信息结合比以往任何时候都更紧密。然而,超大模型虽好,但是要想训练、维护好一款大模型并不容易。大模型对算法、算例和数据的要求都非常高,因此如果不投入巨大的人力和无力很难有所建树,同时,目前市场现有的通用大模型对于特定领域的适用性表现也不佳。
为此,除了上述两大模型外,为了帮助企业用户基于大模型构建未来应用,星环科技推出了 Sophon LLMOps,帮助企业构建自己所在垂直领域的大模型。
作为一个机器学习模型全生命周期管理的工具平台,星环 Sophon LLMOps 针对大语言模型及其衍生数据、模型、应用问题,提供了相应的增强,形成了 LLMOps 的工具链:
首先是样本仓库能力。覆盖训练数据开发、推理数据开发、数据维护等工作,对大语言模型涉及的原始数据、样本数据、提示词数据做清洗、探索、增强、评估和管理。
第二,模型运维管理能力。除了传统 MLOps 的六大统一——统一纳管、统一运维、统一应用、统一监控、统一评估、统一解释外,针对大语言模型的微调、持续提升、评估、对齐等提供从计算框架、工具到计算、存储、通信的调度和优化支持。
第三,大语言模型和其他任务的编排和调度和上线能力。星环 Sophon LLMOps 提供 Agent、Ops、DAG,结合星环的多款大数据、数据库产品,如向量数据库 Hippo 和星环分布式图数据库 StellarDB 等,将不同大语言模型、传统机器学习、其他流程等编排成符合用户实际领域和业务需求的任务,并为客户提供服务。
孙元浩预测,未来数据处理将走向智能化、多模态和平民化。让普通人不再需要掌握复杂工具,就可以快速处理数据,这是数据处理平民化的一大追求。
你也「在看」吗? 👇
微信扫码关注该文公众号作者