作者Yaowei (成就你的大事)
看板perl
标题Re: [问题] 请问若想取出句子中的前後几个字的话?
时间Tue Mar 20 22:33:02 2007
就是一个句子中可能会有多个<PTN>存在
因此我想找出在两个<PTN>之间的句子,前提条件是需要满足
interaction,interactions,interacts 这3个字的其中一个字的话
就取出由<PTN>前後所组成的这个句子(所以是指以<PTN>做为起始
但有可能会出现的情况是
句子中有出现interaction,interactions,interacts 这3个字的其中一个字
可是情况一是 只有在上述的字中的左边出现多个<PTN>,因此我想取出
由interaction,interactions,interacts中的字往左比对,直到找到包含两个<PTN>为止
但有可能左边也没有任何<PTN>出现,因此就取到最左边遇到.,;\s或句首为止。
情况二如上 只是左边改成右边,然後往右比对,直到找到两个<PTN>为止,若找不到
任何的<PTN>则往右比对,直到遇到.,;\s或句尾为止。
即我都希望是最小的比对,而不是最大的比对(贪婪?)
再次感谢 麻烦了@@
※ 引述《Yaowei (成就你的大事)》之铭言:
: orz那我重新解释一下好了= =顺便改一下题目好了= =仅取出句含<PTN>之间的句子
: 就是希望找出句子中以interaction,interactions,interacts这三个字的其中之一
: 当作主轴中心,然後往外(左右两旁延伸出去),
: 规则是:所以我只想取出句含两个<PTN>之中的句子 <PTN> .* <PTN> <-- 第一句
: 若在左方或右方找不到任何<PTN>则往右边做比对<PTN>的动作<--第二句的结果
: 同样也是取出包含两个<PTN>的句子<---第三句
: 所以如果改成以上的条件的话,则是不是需要写成两个判断式来判断即可
: 即 if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/){
: print $&;
: }
: elsif(/\s(interaction|interactions|interacts)\s.*?<PTN>.*?<PTN>/){
: }
: 只是我希望可以看看能不能只写成一个句子而已,且最多只出现2个<PTN>而已
: 然後在if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/)
: 的这句常规表示式中因为有可能前或後面(左/右边)不会出现<PTN>
: 的标记所以就需透过另一个常规式来撷取出所要的句子
: 因此,是不是需要将elsif的句子改成
: (/(<PTN>.*?<PTN>\s)?\s(interaction|interactions|interacts)\s(.*?<PTN>.*?<PTN>)/)
: -->是否可以将此常规表示式搭配elsif的条件而整合成一个式子而已
: 谢谢大家罗^^表达的不好 若有疑问 欢迎补充^^
: : 若我想找出有符合下列样版中的字
: : interaction,interactions,interacts
: : 并由它们其中之一个取出如下的内容:
: : 往前或後後推直到找到前後各有一个<PTN> 的两个字,若前/後无<PTN>则往另一方向取出
: : 两个<PTN>为止,若往前时是句首则停止,若往後的第二个字是.则也是停止。
: : 请问该如何作呢?
: : ----------------------------------------------------------------------------
: : 比对到:interaction
: : <PTN> mRNA coimmunoprecipitated with <PTN> in resting synaptoneurosomes, but
: : the interaction was lost shortly after <PTN> treatment.
: : ---------------------------------------------------------------------------
: : 比对到:interactions
: : Our data suggest that physical interactions between <PTN> and <PTN> mRNA
: : underlie translational repression,
: : ----------------------------------------------------------------------------
: : 比对到:interacts
: : 来源:
: : <PTN> interacts with <PTN> RNA as well as a number of <PTN>,
: : ----------------------------------------------------------------------------
: : 目前的想法是不是需要在读档的时候,加入不同的条件式来判= =
: : 那如果是样子做的法,那麽不就需要写很多if或者是case之类的判断
: : 且若用常规表示式来写的话,则好像不能只用一个就解决???
: : 有其它人有更好更方便的方法吗?可以一起讨论或分享心得吗?:)
: : 感谢你^^
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.142.234
1F:推 david220:那有没有前後都没有<PTN>的情况呢? 03/21 12:52
2F:→ david220:另我觉得用split('<PTN>', ...)应该就办得到了 03/21 12:52
3F:推 Yaowei:一定会有<PTN>,且句子中一定会出现interact那几个字@@ 03/21 19:10