< 返回版块

Mike Tang 发表于 2020-03-30 12:15

Tags:search

论坛搜索功能已经恢复,欢迎大家测试试用。

另外,下一步要改的两个东西:

  1. 添加 自己已发过的文章 索引面板,当然,也可以查看别人发过的。
  2. 将论坛数据库彻底 git 化。意思就是数据库中的文章和评论内容,生成 md 文件,存储在比如 github 的一个仓库中,作为数据备份和资源分享之用(当然会有版权声明),方便用户将数据下载到本地,进行本地搜索(也就不劳烦写爬虫来抓本站了)。甚至可以考虑使用 git 进行提交服务。未来,可以将现在的论坛界面,视作 git 仓库的 view,现在的 postgresql 数据库,视作 git 仓库的缓存服务。具体实施,有一些初步想法,有没有朋友有现成的经验,欢迎分享指点~~

评论区

写评论
作者 Mike Tang 2020-04-16 09:41

您的經驗很重要,感謝!

jellybobbin 2020-04-01 22:40

就不好搞 对以下内容的回复:

jellybobbin 2020-04-01 22:38

比如我有两个目录:

水贴

  • 文章1
  • 文章2
  • 文章3

问答

  • 问题1
  • 问题2

如果是数据驱动文件的方式(数据库为主,git为副本),那当我把水贴这个目录改成水区的时候,是可以改git文件目录名称的

但是如果是文件驱动数据的方式(数据库为副本),当涉及到目录操作(尤其是多层次)的时候, 就是好搞了

jellybobbin 2020-04-01 22:27

最开始有这样想法是因为我自己做的各种笔记都是md文档,放在git上的,我想的是, 我本地改了之后,push到git之后,webhook就通知服务器pull, 然后用于网站.

jellybobbin 2020-04-01 22:24

这里面还是有很多问题的, 比如有一些是没有存储价值的,比如本文,比如有些水贴,怎么差别化,一个栏目就是一个目录?比如水贴,问答,另外一个就是git上的目录结构是个啥样?如果更新用git提交的方式, 那是先更新数据库还是先更新git仓库,我原来也有这样的想法, 但一直没动手去做.

我觉得数据库为主,git做为副本, 可行性要比数据库做副本大.

作者 Mike Tang 2020-03-30 12:38

最近在整理历史资料,发现,如果只重视数据的存储,而忽略数据的检索,那么,数据早晚会成为死数据。其实跟丢失没多大区别。

比如,一个数据库的备份文件,如果不启动数据库来读取它。那么,是比较难直观地去检索它的内容的。

比如,一个几个 G 的 tar.gz 包文件。如果包名字取得不好,放在那儿,可能几年后,就会忘记里面存储了哪些内容,在不解包的情况下(往往解包的条件要求比较高,比如在手机上基本不会解压一个几个 G 的压缩包),是无从检索的。这些数据,其实就是死数据了,发挥不了它的功效。

图片和视频数据现在有大量的云服务来处理(虽然也不令人放心)。

而更重要的文字信息,存储成文本文件(不依赖于任何软件,如 word, wps, web docs, 手机上的便箋,记事本,石墨文档,有道云笔记,飞书笔记)的形式,也许是最好的选择。

所以,这一抹多在线文档编辑软件,其实犯了同样一个错误。过于重视信息的表现和操作,而忽略了文档的存储。按照上述思路,应该以(文本)文件存储为核心,在其上,开展应用形式。所以从这一点来讲,百度网盘现在是最有潜力的服务。就看百度网盘有没有意识到这一点了?

有没高见?

作者 Mike Tang 2020-03-30 12:19

经历过各种网站服务持续几年甚至十几年后关停,导致数据丢失的情况。就会发现,原来文本文件,才是最 NB 可靠的存储信息的方式。

甚至可以结合一套分布式存储的体系来尝试。

进一步,可以思考:怎样,才是知识存储和检索、分享、传播最好(有效,可靠等)的方式?

1 共 7 条评论, 1 页