作者thunderman (.................)
看板Google
标题Re: [趣闻] Google胜华佗 诊病超准确
时间Fri Nov 24 15:00:00 2006
※ 引述《wasabicat (猫科动物)》之铭言:
: ※ 引述《thxmotor (天天都有好狗运)》之铭言:
: : Google胜华佗 诊病超准确
: : 中时电子报 更新日期:2006/11/11 04:09 记者: 潘勋/综合报导
: : 举例来说,有个四十八岁男病患有「多重脊椎肿瘤」与「皮肤肿瘤」,两位医师输入这两
: : 个词汇,古钩便回答,病人可能罹患「第一型神经线纤维瘤」,答案正确无误。
: : 另一个病例中,有名男子慢跑时失去意识;输入「心跳遽停」、「运动」及「年轻」这三
: : 个词汇,古钩则回答病名是「阻塞性肥厚心肌症」,也答对了。其他诊断成功的病例还有
: : 库贾氏症、胃肠出血、肌萎缩、脑炎等。
: : http://w114.news.tpc.yahoo.com/article/url/d/a/061110/4/6dot.html
: 这篇看推文的网友好多喔
: 可以问一下到底是该怎麽查询吗?
: 是直接到google上面,输入上面病症的正确英文学名就可以查到了吗?
: 还是有什麽特殊的网页是用来查这个的
: 谢谢大家啦~~~
应该就是把症状描述当做keyword,google会找出一堆相关疾病的网页,
keyword下得好的话,出来的资讯还蛮有用的。
又,google的搜寻引擎真是越做越好。
之前去听了Peter Norvig的演讲,
讲了google在搜寻、natural language processing(NLP)、
computational linguistics(CL)上的发展,
还真是令人印象深刻。
(先说,我不是做NLP、CL的人,或许这些领碱的人会有不同的意见)
他们用了蛮多AI、learning的东西来加强本身的技术。
最值得称道的就是他们的training database,
毕竟是玩搜寻引擎的,他们拥有的training database大的吓人,
相比之下,其它研究人员的training dataset看起来有点像玩具。
(again,我不是做NLP、CL的人,或许实情并不是如此)
就因为database很大,所以他们发展的方法也都是data-driven。
譬如说,他们让电脑自己去learn各辞汇间的relation,语言、句子的pattern。
举例而言,假如你在google上打population japan,
第一项就是直接告诉你日本的人口有多少(电脑直接去网路上帮你找出解答)。
当然有很多别的网站也是做的到这功能,
不过很多是靠定义regular expression、定义population是japan的一个属性,
然後再去各网页中寻找这个pattern,进而找到解答。
而google的作法则是让电脑自己去learn这个pattern、
发现population是japan的一个属性。
另外像google也在做statistical machine translation(MT),
用的也是learning based、data driven的方法,
就是让电脑自己去learn各语言间的对应关系。
google在NIST的Arabic-English跟Chinese-Englis的MT evaluation中名列前矛,
据说他们的team里面还没有chinese跟arabic的linguistic expert!?
(後面这点不是Peter说的,是我听别人讲的,有可能是谣言:p)
对了,Peter还提到了他对搜寻引擎的想法,
大部分的人应该都认为搜寻引擎是单向的互动,
就是由内容提供者提供网页->google分析、整理这些网页
->最後在使用者查询时给出结果。
不过Peter认为搜寻引擎应该是双向的沟通,
因为一般的网页中,绝大多数的东西都是垃圾,只有少数的内容才有意义,
因此只用网页来learning,实在是问题多多(譬如说noise太多)。
但使用者所下的keyword不同,绝大多数的keyword简短、有意义,
因此更适合用来整理、归纳各种资讯,帮助电脑来learn各种语言、辞汇上的关系。
(譬如说如果你想知道bush几岁,绝大多数的人应该是下age bush当关键字,
而不是啥how old is bush之类的,
从这个query就可以知道而age和bush有关系:age是bush的属性之一)
简而言之,当你每次在google下关键字找东西时,
也算是间接的帮助了他们改善整个搜寻的效能。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.30.73
1F:推 MilchFlasche:很棒的分享:) 11/24 17:53
2F:推 MichaelSoft:中研院的简立峰就是作中文资料检索的专家,他目前在 11/25 10:54
3F:→ MichaelSoft:google 11/25 10:56
4F:推 eggimage:这篇文章有1000银 orz... 11/25 23:50