Redian新闻
>
MiniGPT4,开源了!

MiniGPT4,开源了!

科技

大家好,我是 Jack。

一个月前,我发布过一篇文章,讲解了 GPT4 的发布会。

ChatGPT 的对话能力,想必大家也早已体验过了,无论是文本生成能力,还是写代码的能力,甚至是上下文的关联对话能力,无不一次又一次地震撼着我们。

你还记不记得发布会上,GPT4 的多模态能力吗?输入不仅是可以是文字,还可以是文本和图片。

比如输入:(看图)手套掉下去会怎样?

输出:它会掉到木板上,并且球会被弹飞。

甚至画个网站的草图,GPT4 就可以立马生成网站的 HTML 代码。

然而,已经过去一个多月了!OpenAI 至今也没有提供发布会所展示的多模态处理能力!

原本以为还要再等几个月的官方更新,才能体验上这个功能,没想到,我看到了这么一个项目。

该项目名为 MiniGPT-4,是阿卜杜拉国王科技大学的几位博士做的。

最主要的是,完全开源!效果如视频所示:

可以看到,MiniGPT-4 能够支持文本和图片的输入,实现了多模态的输入功能。

GitHub:https://github.com/Vision-CAIR/MiniGPT-4

在线体验:https://minigpt-4.github.io

作者还提供了网页 Demo,可以直接体验:

MiniGPT-4 是在一些开源大模型基础上训练得到的,fine tune 分为两个阶段,先是在 4 个 A100 上用 500 万图文对训练,然后再用一个一个小的高质量数据集训练,单卡 A100 训练只需要 7 分钟。

给大家看几个例子:

通过商品图,直接生成广告文案:

不过目前使用的人数较多,可以错峰使用,或者本地部署一个服务。

本地部署也不复杂,根据官方教程直接配置环境:

git clone https://github.com/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

然后下载预训练模型:

输入指令直接运行:

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml

这个过程需要保证有网络,需要下载一些 BLIP 之类的依赖库。

相信不久的将来,不仅仅是可以多模态输入,还可以多模态输出。

我们可以输入:文本、图像、音频、视频

AI 就能根据我们的需求,生成我们需要的文本、图像、音频、甚至是视频。

一起期待一下吧~

·················END·················

推荐阅读

•   炸裂,AI 打造了一个西部世界!•   为爱发电的博客园要没了??!•   5个令人惊艳的AI项目,开源了!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源版ChatGPT来了?多数任务效果超越GPT3,已开源!闲话人生(232)“漏划的地主”是地主吗?长篇小说土楼情人故事介绍索引OpenAI发布GPT-4,全面升级ChatGPT火了,又一款神器,开源了!ChatGPT 开源了第一款插件,都来学习一下源码吧!张俊林趣谈:GPT4是否已具备类人智慧,为何GPT通过Next Token Prediction可以产生智能民心、深国交、哈罗都考的 —— CAT4测试如何准备? 重磅CAT4真题分享又一个 SQL 神器,开源了!4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...GPT-3 计划开源!Sam Altman 自曝急缺 GPU,GPT-4 多模态能力明年开放ChatGPT成功背后的秘密,开源了!对了,我开了个ChatGPT、GPT4.0分享课GPT4,又爆了!刷榜GitHub!中科院学术科研专用版 ChatGPT开源了!斩获24K star。。论文润色、语法检查,一键搞定!这是Meta版ChatGPT雏形?开源、一块GPU就能跑,1/10参数量打败GPT-3GPT4通过注册会计师考试/孙燕姿首谈「AI孙燕姿」/微软为Win 11添加ChatGPT插件万众瞩目,谷歌的反击战,Bard vs GPT4,效果实测!永动机存在的意义,局限,及禁忌之荒唐中信建投:GPT4及ChatGPT相关应用梳理Agustín Hernández:中美洲建筑背景下的未来主义巨构俄州列车出轨事件圈内人二月记一个厉害的中医GPT,AI老中医开源了!国产ChatGPT又开源了!效果大幅升级,在手机上也可以跑GPT-4平替来了!华人团队开源miniGPT-4,只需23G显存,画草稿写网站,还能帮你修洗衣机ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源美信全球项目[OpenAI]推出GPT-4,ChatGPT炸裂大升级[干货] ChatGPT 创始人用5个词评价 GPT4大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4ToolsGPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火谷歌没开源的PaLM,网友给开源了!千亿参数微缩版:最大只有10亿,8k上下文开箱即用,5个令人惊艳的AI项目,开源了!GPT-3计划开源!Sam Altman自曝急缺GPU,GPT-4多模态能力明年开放不测不知道,一测吓一跳,IBM 入局:开源自对齐方法训练「单峰骆驼」,比GPT4更值得信赖
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。