事由:好讀網站創辦人不幸逝世(消息來源),討論電子閱讀的社團「電子閱讀討論區 」有一些人正在討論是不是能夠備份該網站(討論1 )(討論2),開啟此共筆謀求解決之道。
----
----
技術
網站主體是能WinHTTrack去抓取整個網站,但是它的電子書檔案的連結是不規律產生,無法大量批次抓取。網站大量電子檔也需要一個共有空間上傳。
----------
我這幾天已經砍了一份,總容量大概 20G。(目錄結構與檔名無特別轉換,缺pdb格式,無線上閱讀部分)
因為版權因素無法公開分享,後續有需要或有其他用途的朋友,請私下聯繫。
-----------
好讀網已經關閉了,可以分享好讀檔案嗎?
-----------
這裡也弄到一份 uPDB 及 PDB 書檔(及相關頁面的書籍簡介與勘誤記錄),以原始碼(*.txt+*.inf)形式收入 Git ,並做了一些規格修正。
經統計共 3858 個書檔,另有 5 個無法從原站下載(0U3, H1115, H13A0, H13B2, H13C5),可能得找有檔的人提供。
希望有人能協助調查這些書目前的著作權狀態(公有領域?已絕版?原出版社已倒閉?作者已亡故?仍上市中?……),以利判斷哪些書適合分享。(書檔列表 )
-----------
搞了个镜像网站。
似乎無法連接
-----------
我是貓頭鷹出版,想詢問可否把鏡像網站中,劉慈欣先生的地球往事三部曲:《三體》、《三體II:黑暗森林》、《三體III:死神永生》給移除。劉老師目前尚健在,中港台都買的到書,似乎沒甚麼道理提供免費擴散?
—————
可以試試Wayback Machine的好讀備份,這個版本更新到網站停用,所以應該比較能夠還原原貌。我試着下載過兩本直式mobi,都管用。
https://web.archive.org/web/20201008061317/http://haodoo.net/?M=hd&P=welcome
如果有好讀網站或任何文檔備份的人 請與我聯絡謝謝
電郵是 robianx_yahoo.com.hk 請把_改換成@
python download script (linux)
https://github.com/kenneth-l-i/haodoo-python-downloader/blob/main/haodoo.py