GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页
机器之心专栏
机器之心编辑部
大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的 GPT-4V 也会有「挫败感」。
论文地址:https://arxiv.org/abs/2310.02255 项目地址:https://mathvista.github.io/ HF 数据集:https://huggingface.co/datasets/AI4Math/MathVista 数据可视化:https://mathvista.github.io/#visualization Leaderboard:https://mathvista.github.io/#leaderboard
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章