CJW

CJW 个人博客

分享网络知识和知识记录
github
email

收藏夹清灰术方案与工具

01 🍚
此时正值年末,我正在为年终总结和明年的计划做准备。在这个过程中,我意识到整理浏览器收藏夹可能是一个寻找灵感和填补信息遗漏的好方法。我希望通过这个整理的过程,挖掘出过去浏览网页时忽略的宝藏内容,为我的年终总结提供新的思路和见解。此外,我还期待在这个过程中,发现之前错过的有价值的信息,为明年的计划提供更全面的支持和参考。我决定展开一次整理行动。整个行动分为三步,首先,我决定清理那些满是灰尘,已经失效的网页书签。

我一个个打开收藏夹里的网页链接,发现连接无法打开,或者内容内容已经变了,那就删掉或者归档。这项任务似乎简单,但挑战在于我的收藏夹里堆积了一千两百多个网页链接(现在已经到了一千三了…)。

随着任务的进行,我意识到这项任务比我想象的要复杂得多。即便我每分钟能验证一个页面,也需要专注长达 20 个小时。也就是,假设我每天抽出 1 个小时,也要一个月的时间才能验证完。而这只是整理的第一步,按这个进度总结和计划得都耽误了。

我的收藏夹现状

02 🥘
于是,开始琢磨偷懒之法解决方案。在搜索过程中,我还是挖掘出了解决方案和工具。一些 Chrome 扩展确实可以辅助清理,但它们有的需要付费,有的是直接删除(怎么判断是不是误删呢,有一些链接需要特殊网段,有一些需要科学上网,我想留给自己判断),有的是连标题都没有,也没有找到能归档的功能。

需要开通高级账号

无法恢复

无标题说明
分析了收藏链接失效的逻辑,其实并不复杂,程序只需要能自动挨个访问收藏夹里的所有链接,根据我制定的标准,把不健康的链接标记出来,就行了。

处理逻辑
03 🍻
扩展的开发消耗了一些时间,但最终它还是出来了。它能够自动批量检查我的收藏夹,并会标记出那些无法打开的,以及内容发生变化的链接,最后再由我快速筛选。通过这个扩展,我能够更直观,更快速、更轻松地清理我的收藏夹啦。

扩展示例截图
我立即开始筛选和删除无用的链接,经过工具初步分类后,有 226 个链接已经失效了,最少节省了我接近四个小时,大大大大节省我的时间。

把表面的灰尘快速清理完后,接下来,就是开始整理的第二步,真正地分析收藏夹,归类、连点成线,构建网络。

PS:

把方案的源码上传到 Github,也把写成拓展 1 方便使用,大家有兴趣可以下载玩,这个工具如果有需要还是能接着完善的,希望能帮到大家~

🥢 检查重复链接,检查空文件夹
🥢 提升检查速度
🥢 检查内容变化规则升级(可以利用 AI 进行向量的语义化判断)
🥢 批量删除与归档
Github:https://github.com/IAMSHENSH/g-mark-magic-ext

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。