作者gogoluck (☺低调友达)
看板EZsoft
标题[请益] 乱数选取"固定字数"文字之软体
时间Thu Mar 20 22:08:00 2008
大家好,
请问是否有乱数选取"固定字数"文字的软体呢?
【状况说明】
比方说,在一个有两万字的文字档里,
我需要3个(或许可以依需要调整成更多个)
1000字(或许可以调整成500或700字)
的段落,但不是单纯依序选取,而是以乱数的方
式选取这3个段落。
目前需要英文文件档,如果有支援中文字更好,
谢谢大家耐心地看完描述,
请帮我想想看有没有这种软体吧!感恩~~
(或者php之类的网页程式码也可以)
感谢arthurs21兄的鼎力相助先~
以下继续补充说明,
----[文字部分]----
My name is Bob.
I have a dog.
My hero is Superman.
My brother is Matt.
He likes to play baseball.
His hero is C. M. Wang and Alex.
...
...
(这里有很多字)
...
...
---[文字部分结尾]---
----[状况来了]----
我要X段Y字段落。X=2,Y=10
1.第1个段落的乱数开始运算,结果从"I"开始。
2."I have a dog. My hero is Superman. My brother"(十个单字被选取)
3.不过,希望都是完整句子,所以My brother後面的is Matt也一并选取。
4.第2个段落的乱数开始运算,结果从"play"开始。
(程式或许不是这样写,或许直接从句子的开头开始比较恰当)
5."play baseball. His hero is C. M. Wang and Alex"(十个单字被选取)
6.不过,希望都是完整句子,所以"He likes to"也一并选取。
(所以,程式直接抓句子开头似乎比较好,才不会可能要补前又要补後...)
7.能够完成上述动作,已经很迷人了,感恩的啦!
所以像arthurs21兄的第一版程式,一段一段出现结果
再去复制结果就很不错了!!!
说到这里,不得不再次感谢一下arthurs21的热心,
还直接丢水球询问详细状况,这样的好人~
不多发几张好人卡怎麽行呢!XD
(开玩笑的~希望arthurs21兄不要见怪~)
---[状况来了结尾]---
--
▃ ╭─────────╮
◢ ◣ │宇宙制霸,唯我火星│
●█● ╰─────────╯
◥███◤ ╯
< ▅ > HA~HA~HA~
◢◣ Marvin ψgogoluck
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.223.160.171
1F:→ arthurs21:我想应该没有现成的吧。写个WHS程式应该就能解决 03/20 23:38
2F:→ gogoluck:哇~~不会写程式的说~~>_< 话说WHS是什麽呢?感恩~ 03/20 23:59
4F:→ arthurs21:存成 .vbs 把原始文字档(txt)拖曳进来吧! 03/21 00:04
5F:→ gogoluck:感恩,不过似乎我描述不清楚,变成每个字都是乱数选取~ 03/21 00:23
6F:→ arthurs21:你指的段落是句点到句点间?逗点间?还是Enter? or ? 03/21 00:28
7F:→ gogoluck:应该是乱数找到一个起点,然後往後抓N个字,输出一个段落 03/21 00:31
8F:→ gogoluck:依上面的顺序重复执行选取X段~大功告成。arthurs21真神人 03/21 00:34
※ 编辑: gogoluck 来自: 61.223.160.171 (03/21 01:27)
11F:→ arthurs21:我忘了说会在你拖曳的档案同资料夹产生aaaa.txt的输出 03/21 03:45
12F:→ gogoluck:嗯 有注意到出现了档案,重复执行会直接覆盖之前档案。 03/21 10:49
13F:→ gogoluck:目前测试结果是以上文的文字范例来看,若指定要7字, 03/21 10:50
14F:→ gogoluck:会出现符合要求的结果、空白结果、只有後半句etc,继续测 03/21 10:51
15F:→ gogoluck:以上文范例复制三份在同一档内来测试(让内容多一点), 03/21 10:59
16F:→ gogoluck:输入要30字,会出现上述情形,也有选取过多的情形。 03/21 11:03
17F:→ gogoluck:不知道是否内容太少的缘故,乱数结果都差不多,且选取 03/21 11:06
18F:→ gogoluck:过多单字的结果很频繁。我先找一篇文章来测看看好了~ 03/21 11:10
19F:→ gogoluck:嗯 刚测文章的结果,果然有比较乱数一点,开头几乎都不同 03/21 11:24
20F:→ gogoluck:不过目前还是有选取过多的情形发生,似乎是补句子的时候, 03/21 11:27
21F:→ gogoluck:结尾没抓好,结果又补了一些句子进来。 03/21 11:29
22F:→ gogoluck:刚刚在贴长文章时发现,好像有一些句子间没有空格, 03/21 12:14
23F:→ gogoluck:不知道是否影响判断,正在重测。 03/21 12:16
24F:→ gogoluck:残念,测第三次即发现,还是多抓了中间有句号跟空格的句 03/21 12:18
25F:→ gogoluck:等等要出门一趟,晚上回来继续测。感恩~ 03/21 12:20
28F:推 jgnh:这种事其实用AutoHotkey来写就很简单了(茶) 03/21 15:26
29F:→ gogoluck:感恩的啦!有劳arthurs21兄的帮助,测试OK!!! 03/24 14:33