Redian新闻
>
请教算法:给一堆文件自动tag分类
avatar
请教算法:给一堆文件自动tag分类# Programming - 葵花宝典
k*e
1
什么时候合并? 现在我是两个account没有连在一起,是不是合起来好?合到哪个比较
好?
avatar
s*w
2
还有希望可以连接现成的service,自家train data太慢。
谢谢!
avatar
r*e
3
CO will no longer exist after the two merge

【在 k***e 的大作中提到】
: 什么时候合并? 现在我是两个account没有连在一起,是不是合起来好?合到哪个比较
: 好?

avatar
h*9
4
easy, find the frequency of each word, then rank the top 10 highest frequent
words as the top tags, unbiased approach, simple statistics.
avatar
d*l
5
co ask

【在 k***e 的大作中提到】
: 什么时候合并? 现在我是两个account没有连在一起,是不是合起来好?合到哪个比较
: 好?

avatar
s*w
6
常见词怎么办? and if when ...
还有关键词往往不是常见词,我希望有google api

frequent

【在 h**********9 的大作中提到】
: easy, find the frequency of each word, then rank the top 10 highest frequent
: words as the top tags, unbiased approach, simple statistics.

avatar
l*n
7
你不想train,基本就是要买现成的model,找找vendor吧

【在 s*****w 的大作中提到】
: 常见词怎么办? and if when ...
: 还有关键词往往不是常见词,我希望有google api
:
: frequent

avatar
g*t
8
给个样本,出钱找版上人做一个,可能是唯一的办法。这类模型其实挺难的。


: 你不想train,基本就是要买现成的model,找找vendor吧



【在 l******n 的大作中提到】
: 你不想train,基本就是要买现成的model,找找vendor吧
avatar
l*n
9
这个很花钱的,数据哪里来,tag样本,存储费用,计算费用,还有时间,这些加起来
挺贵的,都是enterprise level的应用solution。板上招人做的话,得先找个土豪才行

【在 g****t 的大作中提到】
: 给个样本,出钱找版上人做一个,可能是唯一的办法。这类模型其实挺难的。
:
:
: 你不想train,基本就是要买现成的model,找找vendor吧
:

avatar
h*9
10
these non important non specific words can be excluded. you can have your
own exclusion list for each specific type of documents.

【在 s*****w 的大作中提到】
: 常见词怎么办? and if when ...
: 还有关键词往往不是常见词,我希望有google api
:
: frequent

avatar
h*9
11
another way:
you can generate a network graph based on your documents using textmining
tools. the key words are the ones with the most connections.
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。