日志压缩式的信息获取
前 AI 时代
存储领域的 Log Append
存储系统里,log append 是一种很常见的写入模式。
- 写 WAL(Write-Ahead Log)时,把变更顺序追加到文件末尾,顺序写比随机写快得多。
- LSM-tree 里,写入先落到 memtable,再刷成不可变的 SSTable;后台再跑 compaction,把重叠的 key 合并、清理过期版本。
- Kafka 的日志也是追加写,retention 和 compaction 负责回收空间。
核心思路都是:先尽情地 append,再异步地压缩。append 快,压缩慢,但只要压缩能跟上,系统就不会爆炸。
工作
我日常的信息输入基本也是这个模式:
我平时主要看 Hacker News 和 Reddit
内核主要是相关会议(LPC、LSF/MM/BPF、OSPM),LWN, 极少看邮件列表,跟踪不过来
AI 相关主要看知乎,小红书质量一般,营销偏多。
于是笔记越来越臃肿,真正内化的东西却没多少。 append 速度远大于压缩速度,信息债越积越多,我发现在笔记仓库中居然有 2000 多个 markdown 文档。 但是我没办法,人的分析能力是有限的,我还要上班。
日志压缩加速
现在有了 kimi、codex、claude 这些工具,压缩效率突然上来了:
直接提供一个文档给 codex ,让他回答我关于某一个领域积累的所有问题
压缩速度第一次超过了 log append 速度。信息不再只是堆在那里,而是能被及时处理、吸收、输出。
也许下一步要关注的,不是收集更多,而是让压缩质量更高。
AI 下如何加速学习
学习,掌握内容现在显然是一个瓶颈,现在人的判断力是瓶颈了。
这里有两个问题,我总是感觉很奇怪:
- 为什么学数学需要做题?
- 为什么去教别人会有比较好的效果?
很多时候,我们会自动的完成 那么,现在我会不会拥有更好的,更加直接的方法来检测,某一个东西,自己其实是没有掌握的。
现在加速的原因:
- 可以快速搭建环境 (simpelfs 写出来之后,有了这个东西作为支撑)
- 这里有一个很关键的问题,让你聚焦于你最关心的部分,而不是开始就被 Documentaion/fs 下的上百个文档压垮掉
- 可以整理重点,让宝贵的认知资源放到最关键的部分,而不是
- english -> 中文
- 背景介绍
- 小的 trick
- 继续看已经会的东西,可以不断的追问他,直到理解了,而一旦理解了,就很难忘记,因为可以随时随地的回忆这些事情。
这个问题的经典的例子在于,线性代数 + cuda 的学习 - 需要知道,我们之前是学过自动化控制原理的,然后马上就发现学不下去了, 遇到了问题很难推进。
- ai 的分析能力很强,不存在看不懂的代码反复卡住人,人仅仅来解决 ai 无法解决的问题。
- 经典案例就是 kvm 嵌套虚拟化
- 这里我需要说明下,如果加速,就是一个很强的能力,我的空闲时间就那么多,不然咋办?
一些有意思的观察:
- 经过多次使用 codex 来学习数学,每次遇到一点困难的时候,我都是会让 codex 来举一个例子,
然后问题一下子豁然开朗了。
这导致了很多事情做法的转向:
- 开始尝试更大的挑战,而不是被曾经的那些东西所限制了
- 一起是从具体开始做起,现在是从抽象做起。
- 为什么,别人写的文章我是懒得看的,但是我不断的和 codex ,最后也是写了几十页的文档,我就是愿意慢慢写出来的。 因为这完全是顺着我的思路来的。但是,最后其实东西都差不多。
当然,现在有了更多的时间来学习了。
2026-05-23 今天想到了一个更高的话题,其实叫不要去学,而是直接去做,才知道什么才是需要掌握的。
2026-05-26 删代码比写代码更快,所以,把书读厚的过程现在就很快了。
## 为什么要阅读源码
阅读了一些源码,学习到了很多东西:
我认为阅读源码是学习水平中不可获取的一环:
- 教科书只是总结了最核心的原理,没有实战,其中的奥妙总是难以体会
- 文档只会分析其中关键结果,只有骨架,没有血肉
代码的阅读可以尽量的广泛。从编译器,数据库,操作系统,CPU / GPU 都是可以涉猎一下,
一个完全不同的领域可以改变你对于计算机的认识。
我自己认为的阅读方法:
- 显然代码跑起来,要读活代码,不要读死代码
- 文档和代码交替进行
- 文档枯燥无聊,代码有时候晦涩难懂,如果在代码看不下去的时候阅读文档,那么就会感觉文档是雪中送碳,在枯燥的文档阅读之后,看看代码,如沐春风。
- 首先将问题列举出来,带着问题去阅读,而不是为了阅读而阅读。
当然,最终的目的是将别人的优秀技术运用在自己的项目中,最好是有所改进。
AI 如何加速创新?
当然,加速学习,就是加速创新,那么如何直接创新?
如何直接制作想法出来?
为什么叫这个名字
遗迹守卫(Ruin Guard)
《原神》中有被称为”耕地机”的机械敌人。
是玩家在提瓦特大陆上经常遇到的大型古代机械。因为它们圆滚滚的身体和挥舞双臂的动作有点像在耕地,所以部分旅行者会这样称呼它们。
此外,遗迹系列还有几种相关的机械:
- 遗迹猎者(Ruin Hunter)—— 会飞的型号
- 遗迹重机(Ruin Grader)—— 更大型的四足版本
在剧情和角色语音中,”独眼小宝”是更常见的昵称(尤其是达达利亚相关剧情里)。这些机械都是坎瑞亚古国遗留下来的战争机器。
可以覆盖的内容
1. 所有的会议
使用 ai 来讲 youtube 演讲的内容整理下来
https://uni.bluepuni.com/archives/the-linux-scheduler-a-decade-of-wasted-cores/
显然,这个要比看 slides 效果要好的
2. 基本经典的书籍
- perfbook
- eac
- CPU 设计的一系列的小册子
- 各种数学书之类的东西
3. 经典的论文合集
就是这个东西了:
- https://papers.cool/ 就是这个东西了
- https://github.com/bojone/papers.cool
https://github.com/AmberLJC/LLMSys-PaperList
现在不用关心
https://github.com/Lum1104/Understand-Anything/blob/main/READMEs/README.zh-CN.md 受 7days-golang 启发。
[ ] 总结一下阅读方法
- uftrace 之类的
- 内核和用户态的分别都需要一个
-
总结两边都可以使用的
- qbe : LLVM 对于我来说已经过于庞大了
- chibicc : 支持 C11 编译器
- lua : 大名鼎鼎的 lua 语言,被广泛的使用,其代码量只有 10000 多行。
- skift : 两万行 C++ 构建的操作,支持 image viewer 之类的
- leveldb
- sqlite
- toydb
- musl : 大名鼎鼎的 musl 库,写的非常清晰
- https://limpet.net/mbrubeck/2014/08/08/toy-layout-engine-1.html
- mold : 配合教程学习 应该是不错的
- https://github.com/doocs/jvm
本站所有文章转发 CSDN 将按侵权追究法律责任,其它情况随意。