这里记录每周值得分享的生统相关内容,周五发布。
本杂志开源(GitHub: openbiostat/biostat-weekly),欢迎提交 issue 投稿或推荐生统相关内容。
封面图

本周话题:引入“学术年龄”作为科研人才评价新标准?
当前科研生态中存在的现实问题:不少科研项目和人才计划以35岁、40岁、45岁等生理年龄作为硬性门槛,迫使部分科研人员为“赶末班车”而追逐热点、追求速成。所谓学术年龄,是指从获得博士学位或正式进入科研体系起计算的科研年限,旨在衡量科研成长阶段,而非个人的生理年龄。它承认科研并非越早越好,也不必都沿着同一节奏前进,而更看重对在学术领域深耕的意愿和能力,无论从何时起步。
生统研究

系统总结了精神卫生科普工作的积极成效及其潜在风险。文章指出,近年来的心理健康宣传与教育活动在减少精神疾病污名、提高公众心理健康素养以及促进求助行为方面发挥了重要作用,显著改善了公众对精神疾病的态度并提高了疾病识别能力。然而,研究同时提示,过度或不恰当的精神卫生科普可能带来意外后果,例如促进公众对普通情绪波动的过度病理化解释、增加自我诊断行为以及改变个体对自身心理状态的理解方式。综述进一步提出,反安慰剂效应(nocebo effect)和患病率通胀假说(prevalence inflation hypothesis)可能是这些负面效应的重要心理机制,即当个体接触到强调症状普遍性的心理健康信息时,可能产生负面预期,并将正常心理体验误认为疾病征兆。文章还特别关注青少年群体,指出其身份认同尚未稳定且易受社会信息影响,更可能将诊断标签纳入自我认同体系。总体而言,该综述强调在推动精神卫生科普时,需要在减少污名与避免过度病理化之间取得平衡,并提出未来应通过优化信息框架、加强心理教育及关注个体差异等方式,提高心理健康宣传的有效性并减少潜在不良影响。
- 论文 DOI:10.1038/s44159-026-00532-7

该研究探讨了危重症患者中系统性分子炎症表型(hyperinflammatory 与 hypoinflammatory)的时间动态变化及其对预后的影响。研究整合了三个独立队列的数据,包括一项前瞻性观察性研究(MARS)以及两项随机对照试验(ALVEOLI 和 CLOVERS),共纳入超过3,800名危重症患者。研究利用基于血浆IL-8、protein C 和血清碳酸氢盐的简化生物标志物分类模型,在多个时间点(入ICU后0–4天)对患者进行炎症表型分型,并评估表型变化与90天全因死亡率之间的关系。结果显示,入院早期属于高炎症表型(hyperinflammatory)的患者比例在数天内迅速下降,而从高炎症表型转变为低炎症表型(hypoinflammatory)的患者其生存率显著高于持续处于高炎症表型的患者。此外,中介分析表明,这种预后改善仅有一小部分可以由器官功能改善解释,提示炎症表型转变本身可能代表一种独立的恢复轨迹。该研究表明危重症患者的分子炎症表型具有明显的时间动态特征,并强调在精准医学和表型分层临床试验设计中考虑表型变化的重要性。
- 论文 DOI:10.1164/rccm.202406-1241OC
博文资讯

亚虹医药宣布其APL-1702(CEVIRA)拟用于治疗宫颈高级别鳞状上皮内病变(HSIL)患者的上市许可申请已获得中国国家药品监督管理局核准签发。该产品是全球首个针对宫颈上皮内瘤变2级(CIN2)患者的非手术无创治疗产品,有望实现由“一刀切”向“优选无创”的治疗路径转变。

Claude Shannon(克劳德·E·香农,1916–2001) 是美国数学家与工程师,被公认为信息论的创始人,也常被称为“信息时代之父”。他用严格的数学语言回答了一个划时代的问题:什么是信息?信息最多能被多高效、可靠地传输?他的思想奠定了现代通信、计算机科学、数据压缩、加密、AI 与数字世界的理论基础。
工具

OpenAI 经济研究团队近期发布了 GABRIEL(Generative AI for Behavioral Research in Economic Literature),这是一个开源的 Python 工具包,旨在利用大型语言模型(如 GPT)对大规模定性数据进行自动化分析和量化处理。该工具可以将访谈文本、社交媒体内容、课程大纲、研究论文甚至图像等非结构化数据转化为可用于统计分析的量化指标。研究者只需用自然语言描述需要测量的概念,例如评价某份招聘信息的“家庭友好程度”,GABRIEL 便可以将同样的分析标准批量应用于大量文档并生成一致的评分结果,从而显著降低人工标注的工作量。除自动化文本编码与指标提取外,GABRIEL 还提供数据集匹配、智能去重、文本段落编码、隐私去标识化以及研究假设生成等功能。作为一个开源工具,GABRIEL 的目标是帮助社会科学和数据科学研究者更高效地利用大规模定性数据开展研究,并推动定性信息在量化研究中的应用。

一个用于纵向数据轨迹分析的 R 软件包,主要用于识别和描述个体在随时间变化过程中的发展模式或变化轨迹。该包提供了一系列统计方法,用于对重复测量数据进行轨迹建模和聚类分析,通过比较不同个体随时间变化的特征,将具有相似变化趋势的个体归类为不同的轨迹组。traj 包支持多种轨迹特征的计算与可视化,可用于探索性分析纵向数据中的异质性变化模式,在流行病学、医学研究以及社会科学等领域的长期随访研究中具有广泛应用价值。
资源

Dimensions 是由 Digital Science 开发的一个综合性科研信息平台,旨在整合全球学术研究的多维度数据资源,为科研人员提供文献检索、研究评估与学术趋势分析等服务。Dimensions 平台不仅收录了大量学术论文,还整合了科研项目资助信息、专利、临床试验以及政策文件等多类型研究数据,并通过引用关系和关联网络对不同研究成果进行链接,从而构建完整的科研知识图谱。用户可以通过 Dimensions 的检索系统快速发现相关研究文献,分析学术影响力指标,并追踪研究主题的发展趋势。与传统文献数据库相比,Dimensions 更强调多源科研数据之间的关联与可视化分析,为科研人员开展文献综述、研究评价和跨学科探索提供了重要工具。

Roman Vershynin 在加州大学欧文分校开设的High-Dimensional Probability课程提供了一套面向研究生层次的概率论教学资源,主要介绍现代数据科学与高维统计分析中的概率理论基础。课程内容围绕高维随机变量与随机向量的性质展开,系统讲解集中不等式、次高斯与次指数随机变量、随机矩阵理论以及稀疏信号恢复等核心主题。这些理论是理解现代机器学习、压缩感知和高维统计推断的重要数学基础。该课程与Vershynin于2018年出版的教材High-Dimensional Probability: An Introduction with Applications in Data Science相配套,课程网页提供了讲义、习题等学习资料,是统计学、应用数学和数据科学领域广泛使用的开放教学资源之一。
贡献者(GitHub ID)
「OpenBioStat 生统爱好者周刊」运维小组:
- [
@Leslie-Lu](陆震) - [
@YihanChen325](陈奕含) - [
@kirihsia](夏鑫辛) - [
@GCRPM](徐林玉)
订阅
本周刊每周五发布,更新在微信公众号「陆震生物统计」(luzhen-biostat)上,微信搜索陆震生物统计或者扫描二维码,即可订阅。

同时,本周刊同步支持 RSS 订阅;本周刊同名中文播客现已正式在苹果播客(Apple Podcasts)和小宇宙平台上线,搜索生统爱好者周刊即可订阅收听。该播客内容基于本周刊公开内容制作,相关学术论文链接及原始资讯请查阅本周刊文字版。
(完)