作者biotite (山水寄情)
看板Geography
標題統計與地理 原 Re: [新聞]重新認識高雄學
時間Tue Dec 19 01:40:12 2006
老實說, 和國外相比, 台灣在人文地理領域作計量的實在很少
像T大系主任, 現在看起來是非常質性的研究, 但她博士論文可是非常計量的
而她所有的研究生中, 也只有1人用統計的方法做臺北市的住宅分化, 其他也偏質性
我覺得這是台灣地理界的瓶頸 讓許多珍貴的資源沒法大量被應用及闡釋
官方和學界都有責任來改善這個困境
舉例來說, 台灣做的戶口普查, 真的很花錢
但要分析戶口普查的資料的成本可是非常大, 而且不好用
隨便舉兩個面向, 1. 最小的加總單位是里, 對都市規劃而言, 里的尺度還是偏大
2. 資料難以下載, 而且無法依使用者需要量身訂做
而地理資訊圖檔不但難以流通, 而且通常只有空間圖層而沒有屬性資料
當這兩者都缺乏的時候, 一個小小的研究生有什麼資源可以做空間統計?
悲觀的是, "據瞭解", 台灣的主計處非常保守, 連增加普查的1個新欄位都不肯
更不用說願意從分享, 擴大運用的角度來提供這些資料供各學科及公司行號使用
可能是上億的的調查經費, 印出那幾本報告書就劃下句點了...
"據知情人士"透露, 許多地理學界大老雖然倡議地理資訊流通自由化
但資訊代表的就是利益, 許多用政府預算及學校廉價勞動力產製出來的圖層
在國防機密, 著作權等大帽子下, 這些納稅人付錢產製的資料卻變成準私人財產
資料可能都有, 但要不就是靠關係, 不然就要經過某某政府單位行文+$$才能取得資料
別的不說, 從R大的貼文中, 可以知道賴老師那裡有很多資料 (空間+屬性)
可是從地圖研究室的觀點而言, 要分享這些資料, 可能有很多顧忌
也許有版權問題, 也許有和別的政府單位或合作默契的問題
台灣不是很重視SSCI數目?
把這些限制釋放開來, 相信地理學界在SSCI數, 應該可以有小幅度的跳躍
※ 引述《evilove (誠實是被選擇的)》之銘言:
: ※ 引述《biotite (山水寄情)》之銘言:
: 這也是我困惑很久的地方
: 書上明明拿成功失敗二項式樣本的例子表示機率各50%
: 可是我讀過論文中
: 沒有一個人是根據你所說的量尺來決定抽樣方法
: 包括大家推薦的洪老師
這可能是學科領域不同所致
如果我要用各地區平均受教育年數來預測各地區平均薪資
則X, Y都是絕對數值, 而非機率
: P代表的應該是事先知道母體比例下才能知道的
: 在不知道母體的比例我們通常取P=.50的情況下讓樣本的變異最大
: 所以是不是其實跟量尺無關呢?
: 只是我又很困惑
: 有些資料官方有~譬如性別可能50/50 年齡可能10/20/25/25/20
: 區域的資料也有其比例
: 那抽樣時如果同時考量應該怎麼設P值?
一般這樣抽樣, 多半看兩者是否相關, 跑迴歸或比較平均數
看的是影響顯不顯著 P值是事後檢證而非事前先假定 0.5最大
當然, 樣本數也是越大越好
我做的是全部母體的分析, 一共4萬多筆
: 又~問卷題項通常是未知的,又怎麼跟上述同時考量?
??? 不是很懂
: : 3. n >= 30 是個經驗共識,就像為何講95% CI 一樣
: : 當然,這是個可以接受的臨界值,若只抽樣30個,必須要有補充說明來合理化之
: : 另,我沒注意到你說的表,但我想是因為有這經驗共識,表才會這麼製作
: 這個真的不是共識
: 管中閔老師的書開宗明義就提這個觀念很多教科書都混淆
: 至於細節我已經提過是沒有根據的
: http://www.sinica.edu.tw/~ckuan/books.html
若不是理解有差異, 不然就是管的一家之言
儘管權威有代表性, 但不需要盡信權威, 否則, 牛頓之後也不會有愛因斯坦了
我看該連結, 只是說:他們也錯以為樣本規模超過30或50時, 中央極限定理就一定成立
有時候, 樣本數會受限於各項資源及研究議題
舉例來說, 要分析台灣各縣市政府資本門預算的比例與民眾對縣市政建設的滿意度
即使全部的普查也就25個 而研究者若用6個個案來分析, 也未必沒有統計上的意義
: : 4. 各縣市抽100個,最後可以用人口加權來再現全台的面貌
: : 至於你說的抽樣不均(1萬抽1個或1000抽一個),在統計上沒差,因為這是統計
: 我之前提過
: 事前可以控制抽到的機率相等會優於事後的加權
: 我提的方法是大家慣用的P.P.S
: (probability proportional to size, P.P.S)
: 至於你說的這個概念我真的不懂
: 可以請你多說一些嗎?
如預計總樣本為2300個 我台北市和澎湖縣都抽100個
但在呈現全台的面貌時, 台北市的相對權重可能是 1/10 澎湖縣每個個案權重為 1/250
這樣可以避免將人口少的縣市的特性過度誇大, 但又可突顯地域的特色
若你平均抽的話, 2300個個案澎湖大概只有10個樣本, 樣本數過小
除非研究者不想探討地域特性, 只想呈現全台的面貌
: : 5. 就選舉政黨傾向而言,就縣市討論是有意義的,涉及空間問題
: : 如各縣市人口結構、產業結構、歷史文化社會因素等
: 同意
: 不過我好奇的是里的13個怎麼被算出來的:P
: A大趕快來解惑吧
我越界了..不過我猜這應該事先決定樣本數及里數 之後除下來的結果
所以應該有150個里 可能是都市 城郊 農村 各50個
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 165.91.197.242
※ 編輯: biotite 來自: 165.91.197.242 (12/19 02:08)
1F:→ biotite:不小心覆蓋到推文 抱歉 (麻煩請重新附加) 12/19 02:08
2F:推 evilove:沒關係,補充一下我說的P值是計算樣本數公式中的母體比例 12/19 02:15
3F:→ evilove:b大說的應該是power值 12/19 02:17
4F:→ evilove:準備出國哩,回來再跟各位聊~ 12/19 02:17
5F:推 biotite:抱歉 我自己觀念搞錯 把此P當彼P 12/19 02:24
※ 編輯: biotite 來自: 165.91.197.242 (12/19 02:26)
※ 編輯: biotite 來自: 165.91.197.242 (12/19 02:34)
6F:推 nuo5218:看到賴老師所以推.. 12/19 04:44