ChatGPT教你写AI包教包会，7段对话写个识别模型，准确度最高达99.7%

公众号新闻

2023-02-07 15:02

白交发自凹非寺
量子位 | 公众号 QbitAI

现在，AI小白甚至都不需要看教程，仅凭ChatGPT就可以创建模型。

它不仅帮你找数据集、训练模型写代码，还能评估准确性、创建程序一步到位。

就有这么一个25岁小哥，让ChatGPT帮他创建了个地理位置识别程序，最终准确率最高达99.7%。

而且各种细节步骤全在，一边干活还一边教你学习。

这一波，被ChatGPT感动到了。

更贴心的是，在每次答疑解惑完，ChatGPT都会说上一句：如果你有任何疑问，请告诉我。

具体实现

项目一开始，这位小哥开宗明义：我不想努力了，你可以帮我创建一个AI程序吗？

以两个坐标为输入，并预测他们在哪个国家。

而ChatGPT“欣然”接受挑战，还提醒这位小哥，需要相应数据集，否则模型无法训练。另外要是还有更多信息，就更好了。

首先，需要找到合适的数据集。

小哥再问ChatGPT，结果它到是二话不说直接扔出了三个供其选择，介绍链接都有。

从三个数据集来看，自然地球数据集显然更好，而且还有“边界”、海岸线等信息，这也就意味着要向模型解释“边界”概念，分隔标签。但作为新人而言，第一个数据集与任务相关的数据更多，模型更容易实现，作者最终选择了第一个数据集。

将这个决定告诉ChatGPT之后，紧接着它就来教你创建DataFrame（数据框架），并给出了示例代码。

执行成功后，就来到了第二阶段：模型训练。ChatGPT也二话不说地给了份代码，甚至还附上了详细解释。

该代码将使用k-NN算法根据给定的坐标来预测国家。KNN 算法是一种简单的算法，它根据输入的 k 个最近邻的大多数类对输入进行分类。
在这个例子中，数据被分成训练集和测试集，比例为80-20。然后用训练集对 KNN 分类器进行训练，并用测试集对模型的精度进行测试。
请记住，这是一个简单的示例，模型的准确性可能不高。您可以尝试使用不同的算法和k的不同值进行实验，看看是否可以提高模型的准确性.

在丢弃一些空白数据（没有坐标的国家）之后，首次执行k-NN训练成功，并有99.7%的准确率。

不过这个结果并不是那么满意，作者归结了这几个方面的原因：不同国家之间的数据分布不均；存在一些数据错误；偏见等问题。

这样也就来到了第三步：重新评估。