「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024
新智元报道
新智元报道
【新智元导读】近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。
1. 完全用狗狗的声音数据从头训练模型; 2. 在人类语音预训练模型的基础上,使用狗狗声音数据进行微调。
「汪汪」to Vector
要理解动物的交流方式,需要解决三个主要问题:
(1)动物使用的语音和感知单位是什么?
(2)组合这些单位的规则是什么?
(3)这些单位是否有意义,如何将声音单位映射到具体含义?
数据准备
实验者反复按响家庭门铃并用力敲门;
实验者模拟对狗狗主人的攻击;
主人亲切地对狗说话;
主人使用狗通常玩的物品与狗玩耍;
主人执行散步前的正常例行程序;
主人用皮带将狗拴在树上,然后走出视线;
模型
分类任务
对陌生人非常具有攻击性的吠叫(LS2);
对陌生人正常吠叫(L-S1);
负面尖叫(在陌生人在场的情况下)(CH-N);
消极的咕噜声(在陌生人面前)(GR-N)。
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章