测序技术不断升级
2008年,Helicos BioSciences公司推出了全球第一款单分子测序平台HeliScope,但该产品的序列读长较短,系统整体测序错误率较高。随后,针对单分子的长读长测序技术出现。目前,长读长测序平台是指单分子测序长度不低于KB级别的技术平台。如今,已经实现商业化的长读长测序平台主要有Pacific Biosciences公司的单分子实时测序(single molecule realtime sequencing,SMRT)平台和Oxford Nanopore Technologies公司的纳米孔测序(Nanopore)平台。
单分子实时测序平台
Pacific Biosciences公司开发的第三代测序技术称为SMRT,该技术建立在两项重要发明的基础之上,有效攻克了测序领域测序读长短的重大难题。其中,零模波导孔(zero-mode waveguides,ZMWs)技术可使激发光被限定在单分子纳米孔底部的一定范围之内,有效过滤背景噪音;荧光基团通过结合在核苷酸的磷酸基团上,能够帮助DNA聚合酶完成一个全天然的DNA链合成过程。
基于该原理的具体产品有PacBio Sequel测序仪、PacBio Sequel Ⅱ测序仪。PacBio Sequel测序仪是率先实现商业化应用的第三代测序技术产品,其突破了传统短读长测序的诸多技术瓶颈。PacBio Sequel Ⅱ测序仪是PacBio Sequel的升级款,可提供CLR Library和CCSlibrary(HIFI)两种测序模式,其测序芯片上的导孔(ZMW)由100万个增至800万个,理论通量较PacBio Sequel测序仪提升了8倍。同时,CCS reads(测序片段)的单碱基准确度也有了较大提升,同一片段在测序4次后,准确度可达约99%。
纳米孔单分子测序平台
Nanopore是基于电信号测序的技术,原理是通过电场力驱动单链核酸分子穿过纳米尺寸的蛋白孔道,不同的碱基在通过纳米孔道时会产生不同阻断程度和阻断时间的电流信号,因此可根据电流信号识别每条核酸分子上的碱基信息,从而实现对单链核酸分子的测序。由于该测序技术的原理与其他平台有较大差异,亦被称为第3.5代或第四代测序技术。
Nanopore测序仪的具体产品种类较多,均为基于Nanopore芯片而搭建的平台,大到由多个芯片阵列组成的PromehION、GridION系列测序仪,小到可以连接手机Type C接口、电脑USB接口的MnION系列便携式测序仪。其中,PromethION是一款高通量、高样本数的台式系统,其具有48个测序芯片,每个芯片有多达3000个纳米孔通道,总计达 14.4万个纳米孔通道。基于这种模块化设计,测序芯片既可单独运行也可同时运行,尤其适用于大样本量、具有庞大数据量的项目。
上述两类第三代测序平台均具有长读长、无GC偏好性以及可直接检测甲基化修饰等优点。相较而言,SMRT平台无错误偏好,可通过增加数据纠错以提高测序准确度;Nanopore平台读长更长,可达到Mb级别,其中MnION测序仪的尺寸如手机大小,较为便携(详见表)。
应用方向有待探索
目前,长读长测序的第三代测序平台已广泛应用于复杂动植物基因组、微生物基因组、全长转录组、微生物群体研究及人类基因组变异检测等领域的科研项目中,以解决上述领域中检测技术的瓶颈问题。
在疾病检测方面,第三代测序技术基于其单分子检测与长读长测序的特点,在基因组结构变异检测、短串联重复序列(微卫星DNA)分析、单体型分析、真假基因区分、甲基化检测等方面具有独特的优势。尽管目前许多基于第二代测序技术的基因诊断产品已基本成熟,但因高通量测序技术存在读长短、对基因组覆盖不均匀等局限,对SNP和InDel s检测尚可,但对复杂结构变异的检测却无能为力。而第三代测序技术凭借长读长、不需要PCR扩增、无GC偏好性等优势,在用于肿瘤、遗传病等基因检测时,能够进行长片段序列(长度通常大于50bp)测定,可以检测缺失、重复、倒位、易位等结构变异,进一步提高了疾病的检出率,有效弥补了第二代测序技术对结构变异检测的不足。
相较于第二代测序平台,第三代测序平台大幅提升了序列读长,但由于其错误率、成本及对样本要求都较高,算法、软件、数据库等配套技术仍需进一步研究,目前该平台仍处于科研项目应用阶段。针对上述问题,各平台正不断优化升级相关技术,如PacBio测序仪的HIFI技术模式可有效提高数据准确度,Nanopore平台也通过对Promet hION进行设备升级以进一步提高检测准确度。相信随着第三代测序平台的不断发展,其未来在医学领域实现转化应用后,将有效弥补目前针对基因组结构变异等相关疾病检测手段的空白。(作者单位:国家药品监督管理局医疗器械技术审评中心)