Redian新闻
>
MiniGPT4,开源了!

MiniGPT4,开源了!

科技

大家好,我是 Jack。

一个月前,我发布过一篇文章,讲解了 GPT4 的发布会。

ChatGPT 的对话能力,想必大家也早已体验过了,无论是文本生成能力,还是写代码的能力,甚至是上下文的关联对话能力,无不一次又一次地震撼着我们。

你还记不记得发布会上,GPT4 的多模态能力吗?输入不仅是可以是文字,还可以是文本和图片。

比如输入:(看图)手套掉下去会怎样?

输出:它会掉到木板上,并且球会被弹飞。

甚至画个网站的草图,GPT4 就可以立马生成网站的 HTML 代码。

然而,已经过去一个多月了!OpenAI 至今也没有提供发布会所展示的多模态处理能力!

原本以为还要再等几个月的官方更新,才能体验上这个功能,没想到,我看到了这么一个项目。

该项目名为 MiniGPT-4,是阿卜杜拉国王科技大学的几位博士做的。

最主要的是,完全开源!效果如视频所示:

可以看到,MiniGPT-4 能够支持文本和图片的输入,实现了多模态的输入功能。

GitHub:https://github.com/Vision-CAIR/MiniGPT-4

在线体验:https://minigpt-4.github.io

作者还提供了网页 Demo,可以直接体验:

MiniGPT-4 是在一些开源大模型基础上训练得到的,fine tune 分为两个阶段,先是在 4 个 A100 上用 500 万图文对训练,然后再用一个一个小的高质量数据集训练,单卡 A100 训练只需要 7 分钟。

给大家看几个例子:

通过商品图,直接生成广告文案:

不过目前使用的人数较多,可以错峰使用,或者本地部署一个服务。

本地部署也不复杂,根据官方教程直接配置环境:

git clone https://github.com/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

然后下载预训练模型:

输入指令直接运行:

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml

这个过程需要保证有网络,需要下载一些 BLIP 之类的依赖库。

相信不久的将来,不仅仅是可以多模态输入,还可以多模态输出。

我们可以输入:文本、图像、音频、视频

AI 就能根据我们的需求,生成我们需要的文本、图像、音频、甚至是视频。

一起期待一下吧~

·················END·················

推荐阅读

•   炸裂,AI 打造了一个西部世界!•   为爱发电的博客园要没了??!•   5个令人惊艳的AI项目,开源了!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
永动机存在的意义,局限,及禁忌之荒唐大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4ToolsChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源对了,我开了个ChatGPT、GPT4.0分享课Agustín Hernández:中美洲建筑背景下的未来主义巨构火了,又一款神器,开源了!谷歌没开源的PaLM,网友给开源了!千亿参数微缩版:最大只有10亿,8k上下文ChatGPT成功背后的秘密,开源了!GPT-4平替来了!华人团队开源miniGPT-4,只需23G显存,画草稿写网站,还能帮你修洗衣机开箱即用,5个令人惊艳的AI项目,开源了!一个厉害的中医GPT,AI老中医开源了!俄州列车出轨事件圈内人二月记闲话人生(232)“漏划的地主”是地主吗?[干货] ChatGPT 创始人用5个词评价 GPT4ChatGPT 开源了第一款插件,都来学习一下源码吧!GPT4,又爆了!这是Meta版ChatGPT雏形?开源、一块GPU就能跑,1/10参数量打败GPT-3万众瞩目,谷歌的反击战,Bard vs GPT4,效果实测!长篇小说土楼情人故事介绍索引GPT4通过注册会计师考试/孙燕姿首谈「AI孙燕姿」/微软为Win 11添加ChatGPT插件国产ChatGPT又开源了!效果大幅升级,在手机上也可以跑GPT-3计划开源!Sam Altman自曝急缺GPU,GPT-4多模态能力明年开放不测不知道,一测吓一跳,张俊林趣谈:GPT4是否已具备类人智慧,为何GPT通过Next Token Prediction可以产生智能中信建投:GPT4及ChatGPT相关应用梳理开源版ChatGPT来了?多数任务效果超越GPT3,已开源!IBM 入局:开源自对齐方法训练「单峰骆驼」,比GPT4更值得信赖又一个 SQL 神器,开源了!GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火美信全球项目[OpenAI]推出GPT-4,ChatGPT炸裂大升级4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...刷榜GitHub!中科院学术科研专用版 ChatGPT开源了!斩获24K star。。论文润色、语法检查,一键搞定!OpenAI发布GPT-4,全面升级ChatGPT民心、深国交、哈罗都考的 —— CAT4测试如何准备? 重磅CAT4真题分享GPT-3 计划开源!Sam Altman 自曝急缺 GPU,GPT-4 多模态能力明年开放
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。