Friday, December 03, 2004

DMK的進展

進行DMK(Digital Media Knowledge-base)已經有一段時間了..
雖然現在已經寫了一個小程式在做bibliography的排版..
不過離我理想的full automation還有一段距離啊

主要就是出現了一些option..讓我不知不覺猶豫起來
1.
偶然發現原來Acrobat本身就有撰寫review的能力..也可以對文件的內容直接highlight
而且透過線上分享就可以synchronize每個人寫的review
實在是一個相當完整的作筆記功能
正在思考要不要乾脆利用這點..直接把一些心得寫進pdf檔裡?
然後用分享的方式共享..而不需要另外建資料庫....
這還得看PHP對pdf的處理能力有沒有到這麼detail的地步
就現在所知道..php處理pdf裡頭table跟image的功能似乎還有缺陷..
這是值得懷疑的

2.
困擾很久的問題....究竟要寫成web application....還是寫成distributed application?
distributed application有好處..可以直接使用Acrobat SDK..功能當然最強
缺點就是使用者必須有裝acrobat....
web application好處是直接上網就可以執行..很方便
缺點當然就是相對的要看php的支援能力..印象中是比較差了....

3.
最麻煩的就是..讀檔以及分析
各種不同的manuscript差異還真大....
即使來自同一個source..不同作者寫起來也不一樣...這還真是ooxx....
像是CG&A的abstract就常常找不到寫在哪裡..這要怎麼parse?
要做到full automation當然是讓使用者直接上傳pdf檔..然後分析產生資料庫檔案..快速方便
不過這部分的執行顯然會是個大麻煩
比較壞的打算就是大家自己key資料..不過這麼一來就會有多一次的人為疏失....
key錯怎麼辦..一點小小的打字錯誤就可能出現duplicate資料....
要分析paper就會有問題..尤其是要找key paper這件事情上....

遇到了三個選擇....要進行下去只能先暫定三個答案
1. 用PHP....翻過了Acrobat SDK的文件....看起來用起來並不怎麼甜....
2. 傾向web application....
3. automation還是要做....不過要做的話勢必會卡很久

另外就是要先把 php跟帳號整合的那部分先試看看....
老師有說用.access就可以..應該先試著玩看看

No comments: