作者regina850 (85000)
看板CodeJob
標題[發案] 希望有人能幫我寫一個程式去抓取網頁中我所要的文字資訊
時間Thu Apr 8 01:43:20 2010
凡是「*[30m」開始的行,都請使用 Ctrl + y 刪除。
請注意:發案人須主動更改標題與內文之案件狀態,
案件狀態、發案人、聯絡方式1、有效時間、專案說明為必填項目,
如果對於發案文章格式有不清楚的地方,請參考置底文章:[發案] 發案範例
案件狀態:發包中
發案人:何小姐
聯絡方式1:[email protected]
聯絡方式2:0919310290
有效時間:2010/04/18(兩週內)
專案說明:我希望有人幫我寫程式去抓取網頁中的資訊,
先將網頁html抓下來,html→txt....
寫一個程式去抓取我要的關鍵字,取得關鍵字輸出
最後要匯出excel檔案
預算:3000元
接案者要求:希望台北市優先,兩週內完成
附註:
(以下內容鼓勵結案後填寫,可以詢問接案人願不願意暴光接案身份)
結案意見:
接案人:
評價(0-10):
說明:
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.62.108.227
1F:→ salonliu:最近程式撰寫有越來越廉價化的感覺.... 04/08 01:49
2F:→ terrybob:= =同意1樓。嘖… 04/08 01:59
3F:推 chicham:可能是會寫的人太多了 04/08 02:17
4F:→ regina850:很抱歉... 04/08 02:48
5F:推 yanli2:這個需求很簡單. 但價格讓我code的慾望都沒有.. 04/08 03:04
6F:→ dirtyeye:我要在你的腳上寫個 c~o~d~e 字 04/08 03:18
7F:→ regina850:再次抱歉...= =|| 04/08 03:38
8F:推 walker2009:這學校作業等級難度的案子 這價錢感覺還ok吧@@? 04/08 04:45
9F:推 earny:其實我覺得這個案子不簡單..有難度...如果不是針對特定網站 04/08 08:39
10F:推 earny:的話....還真的是有難度。 04/08 08:39
11F:推 Dreamer77:就算是作業等級 可是要花時間 那模廉價就沒想做的慾望了 04/08 09:20
12F:推 sioo:這個案子3000絕對有人接,如果沒人接可以找我,但我在新竹 04/08 11:13
13F:→ regina850:謝謝大家關心,已經順利發包出去了!謝謝指教^_^ 04/08 19:55
14F:推 gotoo:如果接的跑掉可以找我 我在台北 XD 04/08 20:37
15F:推 Yaiba:樓上.........看的真遠... 04/08 20:47
16F:→ regina850:謝謝,大家都好熱情!!受寵若驚!!謝謝好多大大給予建議, 04/08 21:45
17F:→ regina850:真的萬分感謝! 04/08 21:46
18F:推 hellolucky:我有跟原PO接洽 這東西沒這麼難 3K~5K是合理範圍 04/08 23:45
19F:→ hellolucky:自己評估 5H賺3K 還不錯 看大家怎麼想啦~XD 04/08 23:46
20F:→ adrianc:個人習慣 再簡單也好 沒5K不開IDE (了解需求的成本也考慮) 04/08 23:51
21F:→ adrianc:不過跟本版的市場可能不太符合 所以我也沒在本版接過 ^^" 04/08 23:52
22F:→ adrianc:BTW 這支程式如果目標網站不特別的話 2H內差不多 04/08 23:53
23F:→ adrianc:值不值得接?...嗯...只能說大家的風格習慣不同吧 04/08 23:54
24F:推 thinkniht:其實我早上就有看到這篇文章...只是因為自己也有事情 04/09 00:20
25F:→ thinkniht:要忙 不曉得該不該接...後來下班後想看看沒人接的話 04/09 00:20
26F:→ thinkniht:我就問看看內容看難度能不能順利完成 不過已經有人接了 04/09 00:22
27F:→ thinkniht:個人覺得 如果環境的部分要求沒有太高 其實這待遇算高了 04/09 00:22
28F:推 lhuan:案子我接的,這價錢還好而已,需求的內容用正規表示法作就好 04/09 01:04
29F:→ lhuan:可是案子的真正問題點在於要把的目標網站 04/09 01:06
30F:→ lhuan:yahoo error999的問題,3000元誰覺的好賺,我發另一個案子 04/09 01:07
31F:→ lhuan:有相關經驗的人,這3000好賺且合理,沒經驗的人,就怕不能結 04/09 01:09
32F:推 hellolucky:所以 是好賺 還是不好賺 有點看不懂....@@" 04/09 01:17
33F:→ DigiPrince:999 直接鎖 IP,還不是加 header 就能解決 蠻煩的 = = 04/09 01:22
34F:推 lhuan:好不好賺,就看你有沒有相關經驗了,就如同資料庫編碼轉換 04/09 01:27
35F:→ lhuan:能不能轉是一回事,轉超過4G的資料庫又是另一回事 04/09 01:27
36F:→ lhuan:再加上要處理可能斷掉半個字元的big5轉utf-8,又是另一回事 04/09 01:28
37F:→ DigiPrince:所以用 random wait 到底可不可以解決 999? 04/09 01:36
38F:→ lhuan:不行,如果可以的話,用php curl就結案了,用不著.net 04/09 01:45
39F:推 yanli2:999就換Proxy換ip就好.. 04/09 02:32
40F:推 followmeyo:接案的人是看在案主是小姐嗎= = 04/09 03:45
41F:→ regina850:我對於這領域不甚了解,但還是謝謝大家關心:) 04/09 13:39
42F:→ regina850:也謝謝許多大大從旁協助,幫我發現許多問題,謝謝大家:) 04/09 13:43
43F:推 masterguy:所以這個案子已經結案了? 04/09 14:14
44F:推 mengjia:誰能用一個ip解error999的問題,我5千跟他買~ :p 04/09 14:41
46F:→ regina850:還沒結案,還在等待成果中,謝謝大家:) 04/09 15:52
47F:→ lhuan:要一個IP解error999不難,難在如何和別的程式對接 04/09 16:31
48F:→ lhuan:就算要賣,也沒有5千這麼便宜,上一個買的,出六萬 04/09 16:31
49F:→ DigiPrince:當然換 Proxy 是 OK... 但是 Proxy list 去哪找比較好? 04/09 17:18
50F:→ DigiPrince:隨便找了用感覺不太妥 = =" 04/09 17:18
51F:→ DigiPrince:而且有些是不是還會加 X-Forwarded-For? 04/09 17:19
52F:→ DigiPrince:Yahoo 不知道會不會抓這個... 04/09 17:19
53F:→ mengjia:因為你出3000,所以我出5000:P 所以這個case沒有999問題阿 04/09 17:56
54F:→ mengjia:對接是小問題 ~ 我可以自己來 ~我很愛學新東西的 ~ 哈 04/09 17:58
55F:→ lhuan:3000是只給抓下來的html檔和處理好的excel檔,不給程式 04/09 18:28
56F:→ lhuan:上個案子的對接,server用linux+php,抓網頁的是vmware的xp 04/09 18:29
57F:→ regina850:嗯,對!!不用程式,給我我也不懂,我只是要資料而已:p 04/09 20:43
58F:推 deduce:請教一下這個案子想要抓的目標是拍賣還是哪個服務呢? 04/11 12:10
59F:→ regina850:謝謝大家~已經結案啦~謝謝大家協助!!:D 04/12 15:06