生统爱好者周刊(第 1 期):博士后,“太多了”?

biostat weekly issue 1
biostat-weekly
Author
Published

Friday, September 26, 2025

这里记录每周值得分享的生统相关内容,周五发布。

本杂志开源(GitHub: openbiostat/biostat-weekly),欢迎提交 issue 投稿或推荐生统相关内容。

「生统爱好者周刊讨论区」

封面图

本周话题:博士后,“太多了”?

据人力资源和社会保障部消息,经过40年的发展,我国共设立了8800多个博士后科研流动站、工作站,累计招收博士后人员超40万人,2024年招收人数再创新高,达4.2万人。

博士后作为中国高新科技的一把利器,应当让其得到“磨砺”,而不是“消磨”,在不断扩招的背景下,更要重视博士后的困境与出路,让其能全身心投入到科研事业中,可以充分发挥高层次创新型人才的创造力、创新力、科研力,如此才能在中国科研之路上,披荆斩棘。

生统研究

  1. Nature | 大语言模型重新定义疾病预测与健康管理

随着慢性病和多病共存问题的加剧,传统的疾病预测和健康管理方法难以应对复杂的健康数据,特别是在长期健康变化的监测和个性化预防方面。现有的疾病预测模型通常只聚焦于单一疾病,忽略了疾病之间的相互影响及其时间性进展。该研究的意义在于,Delphi-2M 模型能够全面预测多种疾病并理解疾病之间的相互关系,推动精准医疗的发展,实现个性化健康管理。通过捕捉疾病的时间性进展,模型为长期健康评估提供了新视角,并展示了在不同地区的广泛适用性,能够为全球公共卫生决策提供支持。

  • 论文链接:https://doi.org/10.1038/s41586-025-09529-3
  1. NEJM | 宫颈癌

该综述系统且全面地介绍了宫颈癌的流行病学、筛查与预防、分期、早期宫颈癌的手术治疗、局部晚期宫颈癌的放化疗、局部晚期宫颈癌的免疫治疗及靶向治疗等多个领域。

  • 论文链接:10.1056/NEJMra2404457
  1. Nat Rev Clin Oncol | 宫颈癌全病程治疗进展

该综述从外科治疗、局晚期宫颈癌治疗和药物治疗几个方面系统阐述了宫颈癌治疗的最新进展。

  • 论文链接:https://doi.org/10.1038/s41571-024-00977-w

博文资讯

  1. 当 AI 遇到医学统计学

NEJM 综述深入讨论将 AI 应用于生物医学数据分析时所面临的统计学挑战,以及研究人员如何才既能从数据中尽可能多地获得信息,又能确保数据驱动的结论准确、稳健且可再现。

  • 论文链接:10.1056/NEJMra2212850
  1. 存在治疗转组的随机试验中调整总生存期的统计学考虑

出于伦理考虑,新药的随机临床试验中通常允许治疗转组。当对照组患者转组到实验组并从实验性治疗中获益时,根据病人随机分配的治疗组别对总生存期进行统计推断将存在偏差。如不进行适当的调整,就无法充分解答“治疗是否有利于总生存期“这一临床问题。本文介绍了IPCW、RPSFTM和Two Stage等常见调整总生存期方法的原理,并介绍这些方法在具体临床问题和估计目标中的应用。

  1. 关于 Vibe coding 以及 AI 的思考

如果负责这些 coding 工作的人员从未参与开发,并且几乎没有机会锻炼编写代码所需的技能,那么这些工作在失去 Vibe coding 以及 AI 辅助后只会变得更加困难。

工具

  1. 本地TeX Live安装部署 - 告别Overleaf的完美替代方案

对于生物统计学研究者而言,LaTeX是撰写学术论文的重要工具。虽然Overleaf提供了便捷的在线编译环境,但本地安装TeX Live具有更多优势:完全离线工作、无网络限制、编译速度更快、可自定义配置、支持大型项目管理。TeX Live是最完整的LaTeX发行版,包含所有常用宏包,特别适合生统论文中的数学公式、统计表格、流程图制作。本地部署后可配合VS Code、TeXstudio等编辑器,提供语法高亮、自动补全、实时预览等功能,大幅提升写作效率。对于需要处理敏感数据或大型统计分析报告的研究者,本地环境更安全可靠。

  1. mLLMCelltype: 基于多语言大模型统计共识的单细胞RNA测序细胞类型注释工具

mLLMCelltype 是一个创新的 Python 框架,专门用于单细胞 RNA 测序 (scRNA-seq) 数据的细胞类型自动注释。该工具通过多个大语言模型的迭代共识算法,显著提高注释准确性并提供可靠的不确定性量化指标。

  1. 自定义 GitHub Copilot 角色

推文介绍了如何通过项目中的简单 Markdown 配置文件完成 Copilot Chat 行为方式的自定义。AI 正在向直接嵌入到开发人员工作流程中的方向转变。

资源

  1. 学术写作入门必备

提升学术写作水平不仅需要长期的积累练习,也需要掌握一些系统的写作技巧。

  1. 数据论文国家标准

新标准对数据论文的组成部分、撰写格式和编排要求提出了明确规范,这一标准标志着数据论文(Data Paper)在我国科研出版中有了统一的编写规范,为推动开放科学和数据共享奠定了重要基础。

  1. 以编程方式编辑或解析 R Markdown / Quarto 文档的所有方法

推文概述一些以编程方式解析和编辑 Markdown 文件(Markdown、R Markdown、Quarto、Hugo 文件等)的方法。

贡献者(GitHub ID)

「OpenBioStat 生统爱好者周刊」运维小组:

  • [@Leslie-Lu](陆震)
  • [@YihanChen325](陈奕含)
  • [@kirihsia](夏鑫辛)
  • [@GCRPM](徐林玉)

订阅

本周刊每周五发布,同步更新在微信公众号「陆震生物统计」(luzhen-biostat)上。

微信搜索“陆震生物统计”或者扫描二维码,即可订阅。

(完)