c da时至今日,人们对基因分型也有着很多的依赖性,对产品的预期也越来越高。
研究人员首先从g该为全球最大的合作家谱之一用户在g上分享他们的家谱那里获得了万条记录其中万有家族信息。其使用自动化管道删除任何无效拓扑例如拥有两个以上父母的个人。这种自动化方法与系谱学家在关于无效拓扑的决策上拥有%以上的一致性。数据集中最大的一个家谱包括万人在创始人和他们的后代之间平均跨越了代。通过评价线粒体dna (母系传递)和y染色体短串联重复序列(父系传递)等单系标记的遗传分离模式也证实了家谱质量的真实。
接下来作者从在线档案中提取人口统计数据包括出生和死亡期以及个人的地理位置。通过关联相关历史事件例如重要战争中死亡率上升对平均寿命与历史数据进行密切匹配分析并证实人口出生和死亡期进一步得出主要城市中个人的首次历史出现与其建立期相一致从而确定了位置数据的准确性。
作者还创建了一个模型来检测遗传变异包括可加性优势上位性等对长寿的影响该模型表现出了使用全基因组关联研究难以解剖的复杂遗传学。对万对亲属寿命的分析揭示遗传成分具有显著的加性约%显性贡献率较低~%没有检测到上位性表明基因对长寿的作用可能比科学家们想象的小。这些新数据中的加性遗传因素低于先的估计值约%表明致力于从基因组数据中检测致病基因的遗传变异以寻求长寿基因可能比预期的更困难。
此外作者使用他们的数据集来分析人类迁徙模式时发现西方社会中的女性移民比男性多尽管都是短距离迁移。因此作者推测大规模的跨国移民活动可能更多的涉及男性而不是女性。
作者通过分析婚姻半径配偶出生地之间的距离—随着它的增加根据“隔离距离”理论可预测会导致夫妻遗传相关性降低。在当时主要的社会政治事件中平均婚姻半径也如预期的那样发生了变化例如在和工业革命出现后婚姻半径增长。有趣的是在之后婚姻半径的增加和夫妻的基因相关性下降之间存在的延迟在此期间尽管距离越来越远但是个人继续与亲戚结婚。作者将这种现象归因于文化规范的改变而不是世纪早期远程交通的出现。
这项研究证明了研究人员和公众之间(通过在线数据库)合作的有效性。在将基因组测序数据覆盖到这些谱系上之后用这种方法建立的庞大家系将有助于对遗传学和公共健康方面的定量评估。
参考资料:
h : p-