July 26,2007
關鍵字之後
的 CSS 來去調整, 或許有那個 UI 高手能夠
幫忙寫個可以用自動產生調整版型的系統來造
福大家, 我知道我在這方面是很糟糕的人.
昨晚是很難得的 4:00 多後才睡, 最主要是很意
外的解決 Door 計劃中的一個大問題, 所以不只是在
關鍵字中找到一個簡單且合理的合併方式, 也一口氣
的完成利用 keyword woods 來做標籤雲.
最主要是在還沒有做 Semantic Web 之前, 想說
用 Google 來算距離, 但算了半天後, 只有一個結論,
與其真的去算, 還不如直接用字串比對算了, 畢竟事
實上會能夠上排行榜的也沒那麼多, 本身就會做一次
收斂了.
此時也證實一個我說的狀況, 與其開發甚麼可能
須要很偉大的架構, 有時只是一個小小的技巧就足以
做到很大的實用, 例如這個計劃本來想要用語意網路
來做, 但最後轉三圈發現若只是要有八成的實用, 跟
本不用那麼麻煩.
在這次的搜尋關鍵字排行中, 有三隻程式, 一個
是昨天的資料, 一個是一週內的資料, 一個是可以自
定區間的.
在自定區間中, 有兩個參數, 一個是要回推的日
數, 就是 period, 而另一個 rows 則是要出現幾筆
資料, 而系統本身會有自己的 cache, 區間越長, 更
新頻率可能從一天到五天.
而目前是開放最多 30 天內, 以後會試情形的增
加區間數, 因為每一個部落格的點閱數都不一樣, 有
的部落格可能一天資料就很多, 太多天可能不只是都
很無聊的資料, 更有可能算不完.
相較點閱數較低的, 可能要累積 10 天才會有意
義也說不定, 再加上可以調整出現數目, 所以找到最
合宜自己部落格的數目也是相當重要的.
在所有 door 計劃中, 由於是由創市際提供的機
器與頻寬, 所以會掛上創世際的 Logo, 而會提供
graph 這參數讓大家選擇合於自己部落格的圖型, 在
純文字版大家可以自己用 css 去套版, 但也會提供
經過美化的版本.
在 keywoods (關鍵字森林) 中, 因為有一個是
用 table 來括起來的, 所以有個 width 的參數, 除
外跟之前都是一樣的有 period 與 rows, 而在這部
份 default 預設是 period=30, rows=30.
在提供純文字的版型外, 因此大家可以用自己的
CSS 來去調整, 或許有那個 UI 高手能夠幫忙寫個可
以用自動產生調整版型的系統來造福大家, 我知道我
在這方面是很糟糕的人.
當然搜尋關鍵字的觀點與 tag 是不一樣的, 而
有人說部落格觀察要不要推出 tag 系統, 我是還在
猶疑, 但目前已經有部落格資料下的很多 tab 可以
應用了, 因此來個 keywoods 應該不是問題.
但已經知到有很多關鍵字是部落格主本身不想讓
人知道的, 所以除了可以讓使用者去設定顯示與否外,
更可以設定那些字是不要的, 不然又出現 fxxk 現像
則是我們不想見到的.
而已經經過創世際的同意在機器上先推行 door
的網頁, 所以大家到時可以看看這系統是如何運作的.
[連結]
1. Door Open
http://blog.roodo.com/genehong/archives/3710287.html
2. 資料探勘實用是因為小技術
http://blog.roodo.com/genehong/archives/3675143.html
3. door 與semantic web
http://blog.yam.com/genehong/article/10785044
4. 標籤林(wood.urs.tw)
http://www.ithome.com.tw/plog/index.php?op=ViewArticle&articleId=6598&blogId=410
[TAG]urs.tw, 關鍵字, 搜尋引擎, Tag
***********************************************
*前
2007/7/25 下午 03:37:07, 此時已經過忠義站了,
也是一口氣看完 Upaper 與爽報.
*後
2007/7/25 下午 04:04:13, 已經這麼晚了阿?
已經過台大醫院了, 就先寫到這邊.