基因识别,是
生物信息学的一个重要分支,使用生物学实验或计算机等手段识别
DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码
基因,也包括其他具有一定生物学功能的因子,如
RNA基因和调控因子。基因识别是基因组研究的基础。
在早期,基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析,我们能够获知它们在
染色体上的顺序。若进行大量类似的分析,我们可以确定各个基因的大致位置。现在,由于人类已经获得了巨大数量的基因组信息,依靠较慢的实验分析已不能满足基因识别的需要,而基于计算机算法的基因识别得到了长足的发展,成为了基因识别的主要手段。
识别具有生物学功能的片段与判定该片段(或其对应的产品)的功能是两个不同的概念,后者通常需要通过基因敲除等的实验手段来决定。不过,
生物信息学的前沿研究正在使得由基因序列预测基因功能变得愈发可能。