我修改了 Test 程式, 可以自動將產生的 pattern 自動套用到資料檔上, 看看結果是什麼. 這個版本所產生出來的 pattern 雖然又臭又長, 但是的確是可行的. 我相信這個程式應用到其他相對設計比較簡單的網頁一樣是可行的.
在產生 pattern 的過程中, 需要注意的大概就是 .. 之間的 tag 需要想辦法過濾掉, 所以我在程式裡面利用資料找到資料前後最大和最小的 tag 數, 再設計進去 pattern 產生器之中. 如果資料裡面由 tag 分隔成幾段的話, 以現在的程式就沒辦法處理. 不過這應該不是問題, 我想明天就可以處理掉這個問題.
明天想要加入 spider 功能, 讓pattern產生器大展身手一下.
附上另外幾個檔案的測試結果: