Redian新闻
>
有没有谁做 text mining 的?
avatar
有没有谁做 text mining 的?# Programming - 葵花宝典
r*1
1
第一名:天蠍座 得票率3023票
天蠍座,一個強烈,深情,矛盾,特別的集合體。天蠍妹妹性格並不纏綿,卻讓人有過
目難忘的本事,對男生放電的技藝幾乎天生就會,而且往往殺人於無形。對天蠍MM而言
,天生具備當狐狸精的必殺絕技:妖。
天蠍狐狸通常都很妖,雖然身材不見得骨感,但是卻具備足以激發性感的言行舉止,極
其活躍,具有強烈的挑釁性和誘惑力,誰沾上誰就死路一條。所以對於喜歡的男生,她
們就自然能使出花樣百出的“狐媚”本領,哄得人暈頭轉向不辨西東,所以最能勾人魂
的“狐狸精”非天蠍座莫屬了。
第二名:雙魚座 得票率 1917票
雙魚座確實盛產“狐狸精”,他們的狐媚功夫並不是善於耍手腕,而是來自于柔弱的天
然屏障。天生一副楚楚可憐,總是散發出一種無依感,讓男生情不自禁想要保護的雙魚
,有時淚眼,有時笑魘,雙魚座把持的狐狸精秘笈正是“媚”。
當一個千嬌百媚、小鳥依人的女人用眼神、笑容、淚水、語言、性的利箭向一個男人發
射過來的時候,這時候,不管多麼剛硬的男人,都可能像嚴重風化的山體一樣顫顫巍巍
的,隨時可能坍塌成泥末。所以,如果說天蠍是進攻型的狐狸精,那麼雙魚就是以守為
攻型的狐狸精,雙魚座溫柔敏感,天生多情,總是能化主動為被動,表面上看起來仿佛
處處都受制於人,其實心理早有自己的籌謀要是被雙魚愛上的男人,往往最後總是被她
不動聲色“狐媚”到手還不自知,以為是自己把她騙上了賊船。
第三名:雙子座 得票率 1688票
雙子在排行榜中的表現也總是很出色,屬於非常有異性緣的一類MM。他們聰穎,多情,
善變又新潮。在雙子女眼中,感情是一種緣分,而且興趣多變的她清楚自己感情上的變
化多端。她們總是認為享受當下感受戀愛是最重要的一件事,而且雙子女對自己的魅力
是非常有自信的,因此她不會放過任何緣分機會。
而且雙子座特別鍾愛這個證明自己超凡魅力的過程,因為她們特別喜歡看見被放電的物
件神魂顛倒的樣子,所以雙子女基本上是非常盛產狐狸精的星座了哦!
第四名:天秤座 得票率 1684票
天秤女屬於那種很會談戀愛的女生,她會讓很久沒有談戀愛的男人有一種再度回到青少
年時期的快樂的感覺,光是這一點就會把男人迷的暈頭轉向,天秤女另外天秤女也很懂
得委屈求全,以退為進之道,用楚楚可憐的態度讓男人心生憐惜,甚至可以買禮物請另
一半帶回去給對方,非常貼心,完全知道男人要的是什麼,所以男人不被她們迷住才怪
呢。
第五名:處女座 得票率 1453票
處女座排在天秤座之後是意料中事,因為這前後的兩個星座在對美的執著和追求上是頗
有共同點的。而狐狸精首要的條件就是要是美的,就算不美,也要能夠勾引人的姿態和
手段。
處女座雖然通常情況下,完全是個循規蹈矩的賢妻良母,且巨細靡遺,讓人覺得是個優
秀的管家婆。但是別忘處女座還有很悶騷的一面,骨子裡的風騷還是常常不小心會露出
行藏,往往偷偷騷包一回就套到了滿缽滿盆,所以千萬不要小看處女座的本事哦。
第六名:射手座 得票率 1267票
射手座頗有男人緣,因為她們喜歡跟男生相處,她們在女生堆裡可能不太受到歡迎,因
為她們的個性太過自我,但是在男人堆裡,卻往往有讓男人瞬間傾倒的本事。
因為射手座通常外貌美麗,心機單純,加之性格奔放,天生的狐媚幾乎讓男人無可招架
嘛,雖然射手座性格大而化之,但是就是很懂得勾引住男人哦!
第七名:水瓶座 得票率 1311票
水瓶座女生一向認為感情是自由的,緣分不可強求,所以對自己心儀的物件,基本上會
主動出擊,而不管其他。而她們的狐狸精必殺武器是機智,她們頭腦聰慧,理智且善於
利用各種時勢,加上她們一般都很聰穎好學,所以男生往往會覺得她們善解人意,聰慧
可人,所以啊,水瓶座的女生們也是蠻有狐媚天分的星座呢。
第八名:魔羯座 得票率1039票
魔羯座要是有狐狸精的話,那一般都來自於後天的訓練,因為魔羯本身是個並不太懂得
賣弄風情的星座,但是一旦她們確立目標,她們卻會變得非常專業,因為對她們而言目
標至關重要,只要能達成無論是成為歐把桑或狐狸精都不重要,而是怎麼樣有計劃有步
驟達到自己的目的。
所以魔羯座可以通過後天的學習把自己塑造成狐狸精,雖然天生缺少狐媚,奈何天資聰
穎,所以還是很有點有模有樣,只是不論怎樣後天修煉,總比不上渾然天成,只好名詞
靠後了。
第九名:獅子座 得票率 1000
獅子座的魅力跟狐媚的關係不大,她們的魅力來自於高傲和無比自信,她們取悅別人的
方式似乎是先取悅自己,但是獅子座對自己想要得到的東西還是非常上心,到細膩入微
的程度,連最微小的細節她也會得關注,就是這樣,一邊是抑揚頓挫統攬大局,一邊是
細緻入微掌控對方,所以,獅子座說狐媚是排不上號,但是還是頗有留住男人心的手段
的。
第十名:白羊座 得票率 958
白羊妹妹不太懂得當狐狸精的訣竅。她們通常是任性的隨性的,她們對愛情和愛人都很
投入,卻不懂得攻心術,只因她們總是太以自我為中心,缺少了將心比心的本事,所以
,狐狸精的段數級別怎麼都高不上去了,只好區居倒數了。
第十一名:巨蟹座 得票率 691
巨蟹妹妹其實是深諳狐媚之道,但是個性的拘謹,還是抑止了她們的天分展露。所以在
賣弄風情這方面,怎麼樣還是略遜一籌,巨蟹妹妹唯一可以依仗的武器就是溫柔和憂愁
,正是這兩點,讓她們在死心塌地對待一個人的時候可以絕對勝算,不過要當“萬人迷
”的狐狸精,也就不太有能力勝任了。
第十二名:金牛座 得票率 586
金牛座天性裡就是太過固執,固執的個性,是沒有辦法將“柔弱如水”的狐媚本領領略
透徹,在對待男人的方法上,總是很難兩頭兼顧,所以,雖然心如磐石般死心塌地,卻
不具備八爪魚般千嬌百媚的繞止柔功,多少金牛座的賢妻良母就此敗下陣來,也是給金
牛的一個提醒,重新學會以柔克剛之術,其實蠻有必要
avatar
a*e
2
有没有谁做 text mining 的?最近做了一个text mining 的项目。总的说就是处理一
些 text string , 用 regular expression 等,再计算一些 quantity 像 similarity
之类的,由于text string 有许多 pattern, 处理了现有数据的几乎的所有的
pattern 用 regular expression 等,但是就是不知道今后还有什么 pattern ,我告
诉同组负责数据传送的人说以后如果有新的pattern 进来,还要根据新 pattern 改
code, 他说, 那简直是 nightmare, 他说应该有一个 universal 的东西,能一下处理
所有的text pattern ,然后就不用改 code 了。我上来问一下有没有做text mining
的?有没有这样一种universal 的东西, 能一下处理全部的pattern , 然后今后不用
改 code? 我感觉不能,因为 text mining code 都是随着 text 走的,text 变了,
code 自然得变呀。大家觉得?我就想问一下版上有没有text mining 的大拿,知道详
情的?多谢!
avatar
r*1
3
日摩上蟹
看来成不了狐狸精了
哇哈哈~~~
avatar
c*n
4
不懂乱说
哪里有这么好现成的universal的东西
要么让他自己去搞个ml的来生成新的regex
avatar
a*4
5
唉,实属冤屈啊,居然上榜。。。
avatar
b*s
6
@goodbug
he will write millions of classes for you
avatar
r*1
7

我觉得mm有这个潜质。。。
嘻嘻
顶锅盖逃!!

【在 a*******4 的大作中提到】
: 唉,实属冤屈啊,居然上榜。。。
avatar
z*e
8
regular expressions? wth
u do it in wrong/old/stupid ways
try to find some new methods like NLP
otherwise u ppl just waste ur time here

similarity

【在 a*****e 的大作中提到】
: 有没有谁做 text mining 的?最近做了一个text mining 的项目。总的说就是处理一
: 些 text string , 用 regular expression 等,再计算一些 quantity 像 similarity
: 之类的,由于text string 有许多 pattern, 处理了现有数据的几乎的所有的
: pattern 用 regular expression 等,但是就是不知道今后还有什么 pattern ,我告
: 诉同组负责数据传送的人说以后如果有新的pattern 进来,还要根据新 pattern 改
: code, 他说, 那简直是 nightmare, 他说应该有一个 universal 的东西,能一下处理
: 所有的text pattern ,然后就不用改 code 了。我上来问一下有没有做text mining
: 的?有没有这样一种universal 的东西, 能一下处理全部的pattern , 然后今后不用
: 改 code? 我感觉不能,因为 text mining code 都是随着 text 走的,text 变了,
: code 自然得变呀。大家觉得?我就想问一下版上有没有text mining 的大拿,知道详

avatar
m*s
9
本版天蝎的站出来痛陈情史吧
avatar
g*g
10
不需要,正三边到正一万边形只需要一个带参数的类,可以套同一公式。可惜有傻逼不
先写个parser.就是不会算面积。

【在 b*******s 的大作中提到】
: @goodbug
: he will write millions of classes for you

avatar
R*s
11
耶,我是狐狸精。。。。。
avatar
d*u
12
是用JAVA写的吗?用轮子了吗?

similarity

【在 a*****e 的大作中提到】
: 有没有谁做 text mining 的?最近做了一个text mining 的项目。总的说就是处理一
: 些 text string , 用 regular expression 等,再计算一些 quantity 像 similarity
: 之类的,由于text string 有许多 pattern, 处理了现有数据的几乎的所有的
: pattern 用 regular expression 等,但是就是不知道今后还有什么 pattern ,我告
: 诉同组负责数据传送的人说以后如果有新的pattern 进来,还要根据新 pattern 改
: code, 他说, 那简直是 nightmare, 他说应该有一个 universal 的东西,能一下处理
: 所有的text pattern ,然后就不用改 code 了。我上来问一下有没有做text mining
: 的?有没有这样一种universal 的东西, 能一下处理全部的pattern , 然后今后不用
: 改 code? 我感觉不能,因为 text mining code 都是随着 text 走的,text 变了,
: code 自然得变呀。大家觉得?我就想问一下版上有没有text mining 的大拿,知道详

avatar
P*i
13
谁说的?俺岂不命将休矣?

耶,我是狐狸精。。。。。

【在 R**********s 的大作中提到】
: 耶,我是狐狸精。。。。。
avatar
a*e
14
我用python 写的。不咋会用 java. 其实是写了一个 web service ,中间带了些计算
。 python webpy, get rest method. java 能行。这个项目已经run 了快一年了。难
道要重写?

【在 d********u 的大作中提到】
: 是用JAVA写的吗?用轮子了吗?
:
: similarity

avatar
F*t
15
ft, 我也算?
我从来不在男人面前哭的
avatar
a*e
16
Thank you. desides NLP, do you have more suggestions?

【在 z****e 的大作中提到】
: regular expressions? wth
: u do it in wrong/old/stupid ways
: try to find some new methods like NLP
: otherwise u ppl just waste ur time here
:
: similarity

avatar
p*t
17
射手被生生陷害了,这里面有黑幕,票数少的还排前面。。。
avatar
d*e
18
pyparsing.

【在 a*****e 的大作中提到】
: 我用python 写的。不咋会用 java. 其实是写了一个 web service ,中间带了些计算
: 。 python webpy, get rest method. java 能行。这个项目已经run 了快一年了。难
: 道要重写?

avatar
a*4
19
扔个地雷~~~~~

【在 r*********1 的大作中提到】
:
: 我觉得mm有这个潜质。。。
: 嘻嘻
: 顶锅盖逃!!

avatar
c*1
20
Is NLP a 牛刀?

【在 a*****e 的大作中提到】
: Thank you. desides NLP, do you have more suggestions?
avatar
l*m
21
好无辜啊。。。。偶从没勾引过任何人。。。
avatar
l*s
22
我是搞NLP的。
这个自动生成Regex 目前来讲NLP做不到
不知道你的具体任务是什么 基本来讲 可以这个思路:
1.用以前的Regex跑一边 得到一些结果 作为最初的training data
2.用这些training data建一个classifier,named entity recognizer之类的,取决于
你的应用
3.再进来新的数据,就用上一步得到的东西来处理。
4.把得分高的data point加回到training data,重新训练一遍classifier。慢慢的性
能就会越来越好。
感兴趣的话可以查一下active learning和Reinforcement learning
avatar
s*8
23
never say never

【在 l*****m 的大作中提到】
: 好无辜啊。。。。偶从没勾引过任何人。。。
avatar
z*e
24
holy
ppl
use inverted index table
to compare the similarity of two txts
this type of simple requirement could be easily solved by some simple tools
there is no need for ml
avatar
l*m
25
我的意思是到目前为止。。。。呵呵

【在 s**********8 的大作中提到】
: never say never
avatar
l*s
26
就算是比较similarity,也要找到最合适的模型和参数,也不是那么容易的。而这又牵
扯到不少的ML
况且lz这个要求,还并不清楚到底什么细节,只用比较相似度很难讲能不能解决。

tools

【在 z****e 的大作中提到】
: holy
: ppl
: use inverted index table
: to compare the similarity of two txts
: this type of simple requirement could be easily solved by some simple tools
: there is no need for ml

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。