Redian新闻
>
赛博仓颉,在线造字!Stable Diffusion:没人比我更懂汉字

赛博仓颉,在线造字!Stable Diffusion:没人比我更懂汉字

公众号新闻



  新智元报道  

编辑:昕朋
【新智元导读】被中文折磨的歪果仁,开始用Stable Diffusion学习汉字!更绝的是,SD不仅精通汉字,还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏!

学习外语,不是件容易事。

当然,这份苦,不只有中国人吃。

在Reddit上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到的问题的吐槽。

对大部分学习中文的外国人来说,汉字永远是个跨不过去的坎。

没有正确的学习方法,学习者很难记住成百上千个结构各异的汉字。

不过没关系,Stable Diffusion会出手。

字不认识?看「图」!


在Reddit的Stable Diffusion频道,网友分享了文字生成模型Depth2Image。

代码链接:https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt

该模型使用Stable Diffusion的技术,可以将汉字图像转变为它所代表的含义。

例如,用火腿组成的「肉」字,

以及用绳子组成的「绳」字。

博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image就会生成该材质对应的中文汉字。

此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时,也激动地表示:这在教育领域的应用未来可期!

其实在两年前,已经有人从事文字图像化的研究。推特网友@azlenelza就利用助神经网络,通过生成视觉助记符的方式将汉字图形化,表示各自的含义。

Azlen表示,这种方式会让各个汉字的意义和形状之间建立更多的联系,从而使每个汉字更容易记住。

可以发现,当时AI生成的图像更属于艺术字的范畴。例如右下角的图像,小编看了好久才认出是「制」字。
经过两年的发展,文字图像化的技术更加成熟。有了这项技术,或许真的能帮助汉语学习者更好地掌握每个汉字,在汉语教学领域大放异彩。
字不够用?得「造」!

更绝的是,Stable Diffusion还能造字。
在学习了1万个日文汉字后,Stable Diffusion模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。
在这些字中,我们也发现了华点。
Stable Diffusion创造的「马里奥」和本尊相比,不能说毫不相干,只能说是一模一样(好家伙,纯象形字是吧)。
另外,AI模型造的「马斯克」一字也够霸气。称王还不够,直接超级加倍,变「王中王」。
相比之下,卷福和尼古拉斯·凯奇哭晕在厕所。
如果扩大输出图像的尺寸,模型还会整花活,生成一个比二维码还要复杂的「文字」。
密恐人士:6。
评论区有人说:「这不是西夏文吗?」
别说,还真有点像。这AI,知识学杂了。

在中日网友的眼中,这类技术可能只是为了整活。毕竟看惯了本国文字,就算看对方语言的汉字也会感到奇怪。
但对于身处另一套语言系统的人来说,看到一个个结构各异的图像,竟有如此丰富的内涵,或许更能感受到语言和文字的魅力。
巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?
参考资料:
https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw
https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
告诉Stable Diffusion 2.0你不想要什么,生成效果更好:Negative Prompt显奇效PS上的开源Stable Diffusion插件来了:一键AI脑补,即装即用18秒完成渲染!苹果Core ML官宣深度支持Stable Diffusion 2.0Stable Diffusion、DreamFusion、Make-A-Video、Imagen Video 和下一步迷幻的玻璃艺术大脑视觉信号被Stable Diffusion复现图像!“人类的谋略和谎言不存在了” | CVPR202335张图,直观理解Stable Diffusion爵士乐、放克钢琴曲,Stable Diffusion玩转跨界、实时生成音乐耶鲁法学院退出《美国新闻》的排名,哈佛也跟进7 Papers & Radios | 推理速度比Stable Diffusion快2倍;视觉Transformer统一图像文本Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了安卓手机「跑」Stable Diffusion创新纪录,15秒内出图FastTrack Universität 2023莱比锡大学公立语言项目招生简章多哥留学生郑天赐:要懂中国,先懂汉字以色列自驾游(3)地中海空中花园 - 海法Stable Diffusion被起诉!结果人类律师水平拉胯,网友:还不如ChatGPT帮他写AIGC落地门槛被打下来了:硬件预算一口气降至1/46,低成本上手Stable Diffusion2.0,一行代码自动并行CVPR 2023 | GAN的反击!朱俊彦新作GigaGAN,出图速度秒杀Stable Diffusion英伟达超快StyleGAN回归,比Stable Diffusion快30多倍,网友:GAN好像只剩下快了Stable Diffusion的魅力:苹果亲自下场优化,iPad、Mac上快速出图推理速度比Stable Diffusion快2倍,生成、修复图像谷歌一个模型搞定,实现新SOTAGAN的反击:朱俊彦CVPR新作GigaGAN,出图速度秒杀Stable Diffusion2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推3D暴龙模型塞进侏罗纪公园只需一部手机,拍摄角度360°可选,Stable Diffusion又被玩出新花样Jay Alammar再发新作:超高质量图解Stable Diffusion,看完彻底搞懂「图像生成」原理AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像“毕业学长开始撕伞后?!”没人比我更懂瞒天过海!Stable Diffusion 2.1版本发布,涩图功能回来了?民间外交丨多哥留学生郑天赐:要懂中国,先懂汉字畅游法国(40)-敦刻尔克行拒绝白嫖!Stable Diffusion新版:画师可自主选择作品是否加入训练集英女王刚薨逝3个月,梅根和哈利的真人秀来了:没人比我们更懂当受害者2022,晨星舞校,秋舞芭蕾输入文字生成音乐,这个音乐版Stable Diffusion火了,网友:电子音乐界要被冲击了 | 在线可玩
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。