Redian新闻
>
AI进化太快了,新项目已开源!

AI进化太快了,新项目已开源!

科技

大家好,我是 Jack。

这两天,Meta 开源了一个 AI 生成音乐工具 Audiocraft,又火了。

今天跟大家聊聊!

一、Audiocraft

我们先看下效果:

输入文本描述:

80s pop track with bassy drums and synth

翻译:

80年代流行歌曲,有低音鼓和合成音

输出结果:

输入文本描述:

90s rock song with loud guitars and heavy drums

翻译:

90年代的摇滚歌曲,伴随着响亮的吉他和沉重的鼓声

输出结果:

此外还支持上传已有的音乐作为参照,生成音乐。

Audiocraft 主要是利用了一个名叫 MusicGen 的生成模型。这个 MusicGen 是一个单级子回归的 Transformer 模型,在 32kHz EnCodec 分词器上训练得到,具备 4 个以 50Hz 采样的码本。

Meta 团队一共使用了两万小时的音乐。

这些音乐数据在 32kHz 下被重新采样,每个音乐都有对应为本文描述。

除了训练数据,还有评价数据集 MusicCaps。

MusicCaps 由 5500 条专业作曲家谱写的 10 秒长的音乐构成。

音乐的 Encode 阶段,通过实验对四种不同的方式进行了测试。

Transformer 部分训练了 300M、1.5B、3.3B 三个不同参数量的自回归式 Transformer。

感兴趣的小伙伴,可以直接在线体验

https://huggingface.co/spaces/facebook/MusicGen

当然,也可以离线部署,项目地址:

https://github.com/facebookresearch/audiocraft

本地部署的方法也不复杂。

1、先创建虚拟环境:

conda create -n musicgen python=3.9

2、安装依赖:

# Best to make sure you have torch installed first, in particular before installing xformers.
# Don't run this if you already have PyTorch installed.
pip install 'torch>=2.0'
# Then proceed to one of the following
pip install -U audiocraft  # stable release
pip install -U git+https://[email protected]/facebookresearch/audiocraft#egg=audiocraft  # bleeding edge
pip install -e .  # or if you cloned the repo locally

3、然后下载模型权重:

这个在项目的说明文档里就能找到。

4、使用 api 生成音乐。

import torchaudio
from audiocraft.models import MusicGen
from audiocraft.data.audio import audio_write

model = MusicGen.get_pretrained('melody')
model.set_generation_params(duration=8)  # generate 8 seconds.
wav = model.generate_unconditional(4)    # generates 4 unconditional audio samples
descriptions = ['happy rock''energetic EDM''sad jazz']
wav = model.generate(descriptions)  # generates 3 samples.

melody, sr = torchaudio.load('./assets/bach.mp3')
# generates using the melody from the given audio and the provided descriptions.
wav = model.generate_with_chroma(descriptions, melody[None].expand(3, -1, -1), sr)

for idx, one_wav in enumerate(wav):
    # Will save under {idx}.wav, with loudness normalization at -14 db LUFS.
    audio_write(f'{idx}', one_wav.cpu(), model.sample_rate, strategy="loudness", loudness_compressor=True)

二、总结

AI 可以生成图片、声音、音乐,距离直接生成视频,又前进了一步呢。

好了,今天就聊这么多吧。

我是 Jack,我们下期见!

·················END·················

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
有的项目已经在融“C++++”轮了?重大进展!千亿锂矿巨头新项目投产了,影响多大?碳酸锂一度暴跌70%今日实习|奥纬咨询2024暑期实习项目已经开启,要求2025年毕业!陈天奇等人新作引爆AI界,手机也能原生跑大模型了!已开源!申研捷报 |【新加坡国立大学】QS第11,商学院新项目!长篇小说《如絮》第一百一十七章 旧金山-越南-1956-1962年 1 参军非洲城市,增长实在是太快了!求职干货 | ByteDance 2023 秋季实习项目已开!海外求职:互联网(Tech、运营、产品、战投)一早的偶遇对唐诗三百首中,那些难以索解的诗句,我的理解,之三:【杜甫,阁夜】九大投行 | Goldman Sachs(UK)2024实习项目已开,面向24-25届毕业生江苏、广东出现反常现象,打工人开始慌了,一切来得太快了!坐拥多个TOP级开源项目,不搞“竞争性开源”,蚂蚁在玩一种很新的开源刚在一起半年,女朋友就想结婚,是不是太快了?求职干货 | Apple 2024暑期实习项目已开!海外求职:互联网(Tech、运营、产品、战投)刺激!多伦多大瀑布又增新项目:高空漩涡探险,星空下攀岩!现世报,也太快了吧?!遭遇杀猪盘(2)6年之后,李嘉诚欲夺回香港300亿海景豪宅项目?2家内地房企齐声“反对”!项目已售4.77亿..AI声音克隆又进化了,已开源!顶级咨询 | 罗兰贝格 2023秋季PTA项目已开启,直通校招面试太快了!集束炸弹已到货,俄罗斯的大麻烦,乌克兰的大灾难!​Segment-and-Track Anything!视频版SAM来了,分割/跟踪/编辑一切,现已开源!安永宣布全球晋升966位合伙人,四大晋升速度也太快了吧!调查|体育项目已经成为美国富裕家庭儿童的标配?中国军事力量在亚洲能排第一吗?快了!快了!太快了!AI教父突然离开谷歌,最担心的已经开始,IBM刚刚官宣...好家伙,这新项目太优秀了,快开源!(小小说)别来无恙当拥有治愈笑容的小狗挨批后…这变脸也太快了吧哈哈!无语!加拿大宣布:将禁止销售汽油车!公交,卡车也必须全换!项目已投10亿突发!摩托车飞车演员半空摔落,知名景区通报:抢救无效死亡,项目已暂停OpenAI又一新项目,火了!已开源!新项目爆火,GPT 开源了!发展太快了!华裔女孩感冒几天,病情急转直下被迫截肢!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。