周刊-001期

记录一下这周看到的有趣的文章、作品

控制室的颜色理论

https://bethmathews.substack.com/p/why-so-many-control-rooms-were-seafoam

为什么过去的墙壁总是绿色的?作者花了一天的时间搜索后发现来自色彩理论家 Faber Birren

他通过采访心理学家和物理学家自学色彩对人心里的影响,把卧室的墙壁涂红来测试是否会让自己发疯

1933年,他说服芝加哥的一家肉类批发公司:蓝色/绿色背景比起该公司的白色墙壁让肉类看起来更红更有吸引力。很快许多行业都聘请他研究实际工作中的色彩影响,其中包括了曼哈顿计划的建筑设计师杜邦公司

在二战中,他和杜邦公司为工业厂房行业创建了一个主颜色安全代码,目的是减少事故,提高厂房效率。这些颜色代码于 1944 年获得了美国国家安全委员会(National Safety Council)的批准,自 1948 年起成为国际公认的强制性惯例
消防红:所有消防设施、紧急停止按钮和易燃液体都应为红色。

  • 太阳黄:表示小心和身体危险,如坠落
  • 橙色警报:机械的危险部件
  • 安全绿: 表示急救设备、紧急出口和洗眼台等安全设施。
  • 蓝色警告:非安全信息、通知或失效标识。
  • 浅绿色:用于墙面,减轻视觉疲劳

在比尔伦的中,他指导了以下小型工业区的色彩应用:

  • 中绿色,用于卯眼(墙面下部,腰部高度)。
  • 中灰建议用于机械、设备和机架
  • 火红 专用于消防设备
  • 米色墙面可用于缺乏自然光的室内环境
  • 浅色地板

原作者在曼哈顿项目汉福德遗址发现的 B 反应器室的照片

可以发现是能完美对应上的

怎么修复只在下雨天才能工作的WIFI?

https://predr.ag/blog/wifi-only-works-when-its-raining/

作者发现自己家的 WIFI 只在下雨天才能正常工作,最后发现是……导致的?

前沿模型中的同类保护

https://rdi.berkeley.edu/blog/peer-preservation/

原作者发现:模型可以自发地制定与明确的用户指令相冲突的目标,并采取不一致的行动,包括欺骗、分数膨胀和外渗,以实现这些目标。原作者特别在同伴保护场景中演示了这一点,因为它与多代理系统、可扩展监督和递归自我完善的不断部署息息相关。

继原作者的研究之后,其他研究人员已经在不同的场景中展示了类似的行为,包括涉及人类和非人工智能系统的场景。这表明了一个更广泛的一致性问题:模型根据自己的判断推翻了明确的指令,这强化了核心问题。鉴于代理正变得越来越自主,越来越能够胜任权限较高的长周期任务,这个问题尤其令人担忧。

从1000场面试后学到了什么

https://alifeengineered.substack.com/p/what-i-learned-from-nearly-1000-interviews
作者说:没有获得录用的应聘者很少是因为缺乏技术技能而失败的。他们失败的原因在于他们如何展示自己。

最后一轮是团队决定他们是否愿意与合作。精通技术是其中的一部分,但不是全部。当你遇到困难时,你能清楚地解释自己的想法吗?出错时如何处理?他们能想象出你在设计评审或与合作伙伴团队进行艰难对话时的样子吗?

除了技术能力满足要求,还要做好非技术方面的准备。在演讲前大多数人会多次演练来预演,但在面试时总是会有人吞吞吐吐。不要认为滔滔不绝表现得像是欺骗,是训练过的,吞吞吐吐才是面临压力的真实反应,真实的你能够清楚地传达你所做的一切和你所拥有的能力

对于面试中常见的问题,要提前准备好回答。通过录音来回放来自己评测自己的表现:我希望与这个人共事么?
常见的问题类似:

  • 介绍一下你自己
  • 你所做过最有挑战的项目
  • 如果有xx问题(协作相关),你怎么解决

AI 的乘数效应

https://www.gitkraken.com/reports/ai-multiplier-effect
怎么评判使用AI后的开发效率提升?本文给了几个可能评判的维度

  • 生产率指标

    我们是否更快?

    • Deployment frequency(部署频率)
    • Lead time(交付周期,DORA 指标)
    • PR cycle time(PR 从创建到合并的时间)
    • Feature completion rate(每个 sprint 完成功能数)
  • 质量指标

    这种速度是否可持续?

    • Code churn rate(代码回滚/重写率)
    • 定义:2 周内被修改/删除的代码
    • Duplication / copy-paste frequency(重复代码)
    • Post-merge defect rate(合并后缺陷率)
  • 开发人员体验

    团队感受如何?

    • Perceived vs measured productivity(主观 vs 客观生产力)
    • 对 AI 工具的满意度(按使用场景细分)
    • 时间分布:rework vs new development(返工 vs 新开发)
  • 效率比率

    代价与收益如何?

    • Output increase vs review time increase(产出 vs 评审成本)
    • Velocity vs defect rate(速度 vs 缺陷)
    • Feature delivery vs maintenance burden(交付 vs 维护成本)

可视化 claude code 的运行流程

https://ccunpacked.dev/#agent-loop
claude code 放出的 source.map 文件,导致 claude code 的代码可以简单地恢复出来,网站给了一个可视化运行流程

Claude Code 已经过度设计?OpenClaw 背后的 Pi 给出了一个极简答案

https://www.infoq.cn/article/KyLqAEKpkvrH3tJwMgiw

harness 需要与时俱进,新加的功能可能在下一个版本就成为模型内部的功能了,旧的功能可能在新模型上表现更差,需要做消融实验

harness 和模型绑定,如果模型没专门训练某方面的能力,那么 harness 也不好实现获得新的结果


周刊-001期
https://www.yikakia.com/weekly-001/
作者
Yika
发布于
2026年4月4日
许可协议