Redian新闻
>
大模型学会写万字长文,AI企业「波形智能」完成千万元Pre-A轮融资|早起看早期

大模型学会写万字长文,AI企业「波形智能」完成千万元Pre-A轮融资|早起看早期

公众号新闻

10分钟,写一万字小说。



周鑫雨

编辑邓咏仪

来源智能涌现(ID:AIEmergence

封面来源视觉中国

36氪获悉,近日杭州波形智能科技有限公司(以下简称“波形智能”)已完成千万元级Pre-A轮融资。该轮由蓝驰创投领投,西湖科创投、老股东藕舫天使跟投。

波形智能团队成员多有科班出身的NLP研究和海外背景,在长文本生成、Agent框架能力、大模型微调与压缩等领域上具有一定技术积淀以及全球化的视野:

创始人兼CEO姜昱辰本科毕业于浙大竺可桢学院,博士就读于瑞士苏黎世联邦理工大学(ETH),师从国际著名学者Ryan Cotterell,曾在微软亚研院从事大语言模型的训练与推理。CTO周王春澍,博士同样就读于ETH,从事人工智能方向研究。CPO万磊,腾讯出身,过亿月活社交APP高级产品经理,多款AI产品创始人。联合创始人兼COO余腾,曾任美国上市公司掌门教育(ZME)联合创始人兼营销高级副总裁。

2023年下半年以来,行业已经涌现了一批成功提升“记忆力”的大模型,模型上下文窗口从32K,扩展到了一次能理解40万字左右文本的200K。

让大模型读懂超长文本,逐渐不是难题;但让大模型像人一样写万字小说,并不简单。

由于内容规划(如何从输入的数据中选择重要信息)和表层实现(用自然语言形式正确地描述重要信息)仍是难以攻克的难题,生成连续、连贯的长文本尚难以实现。

与此同时,理解和生成长文本对算力和内存提出了更高的要求。波形智能CEO姜昱辰告诉36氪,大语言模型主流采用的是Transformers架构,但缺点在于,其在处理长序列时会面临计算和存储的需求挑战,文本越长,循环次数越多,算力和内存成本会平方级上涨。

对此,波形智能主攻内容创作垂域的长文本生成,于2024年1月29日的技术开放日上发布了一款能生成长文本的大模型:内容创作垂域SOTA大模型“Weaver”。

为了在控制成本的情况下做到无限长文本生成,波形智能曾在2023年5月发表了名为RecurrentGPT的训练范式。姜昱辰介绍,在实际测评中,RecurrentGPT在比GPT-4的文本生成速度快三倍的情况下,书写的效果还要更出色。

通过适配RecurrentGPT框架,Weaver具备更强的长文本生成能力,在长文本和结构化文本生成的上下文一致性上提高了40%。相较于2倍量级参数规模的模型,Weaver系列模型的生成速度更快且效果更好。

基于《繁花》风格,Weaver(右)与GPT-4(中)生成效果的对比。图源:波形智能

应对模型“一本正经胡说”的幻觉问题,Weaver也有了新的解法。2023年9月,波形智能还设计了基于SOP(标准操作流程)的Agent架构:AIWaves Agents。通过对创作文本的过程进行模拟,Agent会根据撰写的题材自主判断什么时候进入剧情设定、角色设定、文风设定等不同阶段,以及不同阶段需要调取什么样的知识库。

与AIWaves Agents框架适配后,Weaver还支持函数调用,拥有超过1000个API上的综合训练经验,能够实现根据用户意图自动理解、规划复杂指令,执行文件处理、数据分析、图表绘制等复杂任务。

更重要的是,要让模型在内容创作领域落地,就必须要让机器写作更有“人味”。

为此,针对模型预训练阶段,波形智能自研了一套自动标注系统“Instruction Back Translation(指令回译)”,确保输出结果是由专业写手产出的内容。

针对对齐阶段,波形智能自研的对齐技术“Constitutional DPO(根据法则的直接偏好优化)”,能够以专业写作方法论为度量标准,指导对齐数据的自动生成。

此外,相较于通用大模型,Weaver还支持个性化知识库的调用。通过利用自研向量数据库生成原生(native)个性化模型,Weaver将召回内容的利用率(指的是召回内容能被输出内容有效利用的比例)提高50%。通过RAG(检索增强生成技术)+仿写的技术方案,Weaver将“越写越懂你”,逐步实现个性化的内容生成。

相较于通用大模型,Weaver能够在更深更广的创作垂直领域落地。目前,Weaver支持写大纲、续写、润色、风格迁移等10类写作任务,覆盖爽文/小说、工作总结、营销写作等30多个领域。

在技术开放日上,波形智能还推出了由Weaver驱动的AI辅助创作工具“蛙蛙写作1.0”。

这款面向专业作者、自媒体/文案创作者的To C生产力工具,为用户提供了模块化的功能。用户可以根据创作需求,一次性输出文本,或者按照大纲-章节的顺序分步写作。同时,蛙蛙写作的写作速度能够达到10分钟1万字。

蛙蛙写作可生成情节和文本。图源:波形智能

蛙蛙写作“智能写作机器人”可以满足不同领域的创作需求。图源:波形智能

目前,蛙蛙写作的商业模式主要为按月订阅,价格为29元/月。与此同时,蛙蛙写作也为企业提供定制化解决方案,并面向开发者开放了API。

姜昱辰对36氪表示,融资款将用于Weaver大模型和Agents平台的研发及其商业化。她透露,2024年第一季度,波形智能将发布70B的模型Weaver Ultra-Max,以及新一代Agent平台Agents2.0。针对剧本创作、私人客服、智能推荐等场景,Agents2.0平台将支持对Weaver大模型的自动微调优化。

36氪旗下AI公众号

👇🏻真诚推荐你关注👇🏻

点击关键词,查看最近的早起看早期
餐饮:「四叶咖」「爆爆姐螺蛳粉」「墨比优创」
医疗:「无忧跳动」「Glowe 阁楼」
文娱:「山漫文化」「集卡社」
教育办公:「推推(Tuitui)」「UPDF」

工业技术:「桥田智能」「贻如生物」「芯率智能」

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
专注竹材料研发,「中竹未来」获数百万元天使轮融资|早起看早期「特科罗」获数千万元Pre-B轮融资,加速雄脱、湿疹等创新药临床试验进程|早起看早期汽车零部件公司「华申瑞利」完成数千万元融资,专注干式线控制动EMB技术开发|早起看早期精品咖啡品牌「比星咖啡」完成数千万元A轮融资,准备冲击千店|早起看早期把台球厅从地下搬到地面,「豆豆台球」完成1000万元天使轮融资|早起看早期若羽臣再投功效护肤,科技品牌KEY iN获数千万融资|早起看早期餐饮供应链走向成熟,「鲜沐」完成新一轮融资|早起看早期「木芯科技」获数千万元A轮融资,自研芯片、传感器加速CGM产品升级|早起看早期卫星维修和太空加油,「三垣航天」完成数千万元Pre-A轮融资|36氪首发「天鹜科技」获数千万元Pre-A轮融资,成功交付多款AI设计蛋白质|早起看早期专注于职业主播孵化,「大捶文化」完成5000万天使轮融资|早起看早期A16Z独家投资,3D技术公司Luma AI完成4300万美元B轮融资|早起看早期《十七帖》读议《五)「贻如生物」获数千万元Pre-A轮融资,生物基皮革制造成本大幅降低|早起看早期以纳米新材料技术撬动千亿温控市场,「磐际智储」完成天使轮融资|早起看早期「星环聚能」获数亿元Pre-A轮融资,加速聚变能商业化|早起看早期2023年收入同比增长50%,思必驰完成新一轮首期2亿元融资|早起看早期齿科企业「清皓普众」获数千万元融资,开发氧化锆、树脂渗透陶瓷等生物材料|早起看早期我最喜欢的一门学科,魔幻穿越《花信风之大雪》打造AI跨境招聘平台,Brix获2000万元天使轮融资|早起看早期四十年前写的村史「仁烁光能」完成数亿元A轮融资,持续推动钙钛矿组件量产|早起看早期聚焦视觉设计职业教育,「元界教育」完成800万元首轮融资|早起看早期《跌宕起伏心灵煎熬的14天》(6) 【自证清白】专注噬菌体杀菌剂开发,「格瑞农」完成近亿元天使轮融资丨早起看早期「嗨小瓶」获数百万元天使轮融资,以功能性咖啡切入运动健康人群|早起看早期「穹顶医疗」获数千万元Pre-A轮融资,开发TI无创深部脑刺激产品|早起看早期「绿色康成」完成数千万元天使+轮融资,专注高端化学品绿色生物制造丨早起看早期铺设10元餐食零售全场景,「味美优品」完成3000万元A轮融资丨早起看早期芯擎科技完成数亿元B轮融资,年内芯片出货量达百万片|早起看早期「虫虫生物」完成数千万元天使轮融资,推动昆虫病毒类生物农药产业化|早起看早期大模型学会写万字长文,AI企业「波形智能」完成千万元Pre-A轮融资|36氪首发聚焦牛肉饭品类,中式快餐品牌「牛大吉」完成8200万B1轮融资|早起看早期智能乐器厂商「戴乐科技」获峰瑞资本领投Pre-A轮融资,旗下「Aeroband」品牌在全球乐器展亮相并获追捧|早起看早期
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。