今晚在线talk: 开发基因型语言模型作为复杂疾病遗传研究的基本模型

生物学,医学,药学,生化和生理功能, 解剖和组织结构, 流行病学和药理学, 细胞和分子生物学、寄生虫学和毒理学

版主: Tlexander

回复
Tlexander楼主
论坛点评
论坛点评
帖子: 2747
注册时间: 7月 22, 2022, 5:34 pm

今晚在线talk: 开发基因型语言模型作为复杂疾病遗传研究的基本模型

帖子 Tlexander楼主 »

今天晚上的talk,环境大家参加:

Title: MAIB-class-014:A Fundamental Model for Genetic Studies of Complex Diseases
Date:10:00pm US East time, 05/06/2023
Date:10:00am Beijing time, 05/07/2023
Zoom ID:933 1613 9423
Zoom PWD:416262
Zoom: https://uwmadison.zoom.us/meeting/regis ... lnGn06TP2E

工智能在最近的十年取得了巨大的进步,以至于有些科学家主要从人工智能的負面方面来评价人工智能对于现代科学研究的影响。不透明、不可靠和欠解释性是他们诟病人工智能的主要论据之一。人工智能研究的主要工具之一是预测。正是预测导致了上述人工智能所具有的常为人们批评的缺点。预测实际上是计算事件发生的概率。事件包含了很多因素。有些因素起作用,有些因素不起作用。因为在许多情况下,神经网络是一个黑箱。它一般没有,在许多情况下也不能识别出那些因素对预测起了重要的作用。在统计学中另一与预测同样重要的是假设检验。Lehmann 为统计学的研究生写了两本书,第一本是估计,第二本就是假设检验。假设检验也是费歇为统计学所奠定的基石之一。假设检验就是识别导致事件发生的因素。在经典统计学里,假设检验的理论都是在欧氏空间中进行的。我们要在人工智能的主要模型中凡是出现予测的地方都要探索建立假设检验的理论,其中包括零假设,检验假设的统计量,统计量在零假设下的概率分布。设计计算一类错误的数字模拟。基础模型是人工智能的主要理论,我们就从基础模型开始来研究基础模型下的假设检验。

开发基因型语言模型作为复杂疾病遗传研究的基本模型。生成式人工智能在哲学和实践方面都提出了巨大的挑战,这是“自启蒙时代以来没有经历过的规模”。现在,AI动力测序仪能够以每个个体100美元的价格进行全基因组测序,这使得产生大量的序列数据成为可能。DNA和蛋白质序列数据的指数级增长正在为发展基因组学和生物医学的DNA和蛋白质语言模型铺平道路。DNA和蛋白质序列包含有关它们的进化、适应性、蛋白质结构和稳定性、突变语义和疾病机制的丰富信息。

序列的生物学特性信息被编码在表示中。这些表示可以用于遗传变异(包括QTL和eQTL)的关联和因果分析。基本模型的一个限制是缺乏假设检验,这导致结果难以理解和解释。为了克服这些限制,我将首先开发一个关于人工智能的假设检验理论的通用框架,并特别针对基本模型进行开发。我将把变换器视为从序列到序列的函数的宇宙近似,并使用非线性测试理论在统计学中定义零假设、测试统计量并推导它们的分布。所开发的测试理论将应用于全基因组关联研究。
回复

回到 “生物医学(Biomedical)”