日本国产欧美大码a视频,亚洲美女久久,人人爱人人搞,亚洲18在线观看,aaa少妇高潮大片免费下载,日日干夜夜草,99免费在线观看

雷特綜合征療法

文檔序號:42297011發(fā)布日期:2025-06-27 18:35閱讀:5來源:國知局

本公開涉及用于治療一類雷特綜合征突變(即c端缺失)的組合物,其包含用于改變突變型mecp2基因中的終止密碼子的堿基編輯器。該改變不使基因返回其野生型(wt)形式,而是重新建立正常水平的形式,所述形式功能上等同于mecp2蛋白的野生型形式。


背景技術:

1、雷特綜合征(rett?syndrome,rtt)是嚴重的神經系統(tǒng)病癥,主要由x連鎖基因mecp2中的突變引起。mecp2功能的喪失在神經系統(tǒng)中具有最深遠的影響,在其它組織中具有最小的表型結果(ross等人,2016)。由于其與rtt和其他病癥中的智力殘疾相關聯(lián),mecp2基因在發(fā)育遲滯的臨床病例中經常被篩選突變。這已經將許多氨基酸改變限定為引起rtt的或不引起rtt的相對良性或中性變體(krishnaraj等人,2017,和karczewski等人,2020)。

2、通過恢復mecp2表達,mecp2敲除(mecp2-null)小鼠中的rtt-樣癥狀可以被挽救,表明該病癥可能是可治愈的。大多數(shù)引起rtt的突變破壞正常mecp2功能所需的兩個結構域;然而,有突變影響這些結構域的c端區(qū)域。這些突變通過顯著降低mecp2蛋白水平引起rtt(guy等人,2018)。有趣的是,缺乏該c端區(qū)域的小鼠表達正常水平的mecp2蛋白,不具有rtt-樣癥狀,表明該區(qū)域對于正常的mecp2功能是不必要的。


技術實現(xiàn)思路

1、異質組的移碼c端缺失(ctd占引起rtt的突變的~10%。它們發(fā)生在mecp2的易缺失區(qū)域內,約c.1110-1210(基于e2同工型(isoform)編號)(bebbington等,2010)。發(fā)明人發(fā)現(xiàn)該區(qū)域中的缺失結果取決于所得的閱讀框??騼热笔コ谠搮^(qū)域中的一部分dna,但仍保持wt閱讀框存在于大規(guī)模測序數(shù)據(jù)庫中,其排除患有嚴重兒科疾病的個體,表明它們是非致病性中性變體(參見圖3)。對于移位到框(n+1)并以氨基酸序列-ser-pro-arg-thr-stop結束的移碼缺失也是如此。然而,其他的引起rtt的移碼缺失出現(xiàn)在rettbase(列出在rtt患者中發(fā)現(xiàn)的突變的數(shù)據(jù)庫)中,移位到框(n+2)并以-pro-pro-stop結束(參見圖2)。

2、本公開基于本發(fā)明人的初始假設,即對于rtt受試者,在mecp2的外顯子4中具有缺失,其導致了到框(n+2)的移位,在終止密碼子之前的兩個破壞翻譯終止的脯氨酸的存在,導致mecp2蛋白和mrna在與無義介導的衰變相似的過程中的喪失?;诖?,發(fā)明人預測,將兩個脯氨酸之后的終止密碼子改變?yōu)橐粋€編碼氨基酸的密碼子,導致進一步翻譯至下一個終止密碼子,可以防止mecp2蛋白的丟失,所述mecp2蛋白的丟失在這一類突變中是致病性的。

3、因此,在第一方面,本公開提供了用于治療受試者的雷特綜合征的方法的堿基編輯構建體,其中所述受試者包含突變型mecp2基因,所述突變型mecp2基因包含c端缺失,所述c端缺失導致翻譯移碼(n+2)和末端為-pro-pro-stop的截短的mecp2基因的表達,其中所述構建體能夠編輯終止密碼子以允許翻譯通讀。

4、如上所述,本發(fā)明人從獲得自患有雷特綜合征的受試者的序列信息觀察到,某些c端缺失,約c.1110-1210(基于e2同工型編號),導致+2移碼和末端為-pro-pro-stop(ppx)的截短的mecp2蛋白的產生。編碼其的核酸序列是cccccctga。為了避免發(fā)生在tga終止密碼子處的翻譯終止,本發(fā)明描述了將tga終止密碼子中的腺嘌呤堿基編輯為另一堿基,例如鳥嘌呤、或任選地胞嘧啶、或胸腺嘧啶,以產生終止密碼子以外的密碼子。例如,將tga終止密碼子中的腺嘌呤堿基改變?yōu)轼B嘌呤,產生tgg(色氨酸)密碼子。如本文進一步詳細描述的,本發(fā)明人已經制造了具有敲入突變的小鼠,其精確地建模了在先前在guy等人(2108)中描述的ctd1小鼠模型中該a至g變化。與ctd1小鼠相比,該新模型沒有顯示rtt-樣表型,并且100%存活長達一年,表明該方法可以用于開發(fā)該類rtt突變的療法。

5、根據(jù)本發(fā)明,一種合適的堿基編輯方法涉及使用單向導rna(single-guide?rna,sgrna)將腺嘌呤堿基編輯器(adenine?base?editor,abe)靶向至tga終止密碼子的靶腺嘌呤。由于局部dna序列的性質,使用識別非規(guī)范pam序列的abe可能是合適的(例如,參見walton等人,2020)。更多的活性pam-變體abe描述于例如richter(2020)、walton(2020)、gaudelli(2020)和chen(2022)中,通過引用將其全部內容并入本文。本發(fā)明人已觀察到向導序列存在于(幾乎)所有ctd?rtt-等位基因中。因此,療法應適用于該全部類別的突變。編輯的基因將不產生野生型蛋白,但將編碼在本文例示的工作中保留天然mecp2功能的截短體(truncation)。

6、本公開提供了與用于治療rtt的其他治療策略相關的許多優(yōu)點:

7、避免基因劑量的問題

8、目前正在探索的用于治療rtt的主要治療策略之一是基因療法,其涉及外源mecp2的病毒遞送。然而,這種形式的基因療法面臨的主要挑戰(zhàn)是mecp2的過表達導致其他神經系統(tǒng)疾病,例如mecp2重復綜合征(mecp2?duplication?syndrome)。因此,難以確定是治療性的同時避免mecp2過表達的劑量。通過使用堿基編輯器(例如abe)編輯內源mecp2,基因保持在其內源調控元件的控制下,從而避免了基因劑量的任何問題。

9、永久校正

10、rtt的其他治療方法包括rna編輯方法或通讀化合物用于無義突變的用途。這些策略的限制是它們將需要重復給藥以便維持校正的mrna的水平。另一方面,諸如使用abe的堿基編輯技術將導致基因的永久校正,并且一旦足夠數(shù)量的細胞已被修飾就證明是治療性的。

11、僅需要一次dna編輯(不依賴于雙鏈dna斷裂(double-stranded?dna?break,dsb)、hdr和修復模板的共同遞送)

12、理想地,基因編輯將簡單地將突變恢復回wt,這在理論上可以使用cas9-誘導的雙鏈斷裂(dsb)的同源定向修復(homology-directed?repair,hdr)通過提供外源dna修復模板完成。在這種情況下,該策略對于離體方法將是非常有用的,其中編輯的細胞可以在將它們返回身體之前首先在培養(yǎng)物中擴增,或者如果其中編輯的細胞相對于未編輯的細胞具有選擇性優(yōu)勢的分裂細胞群體正在被靶向。不幸的是,該方法不適用于rtt,因為靶群體是有絲分裂后的神經元,其中hdr水平低并且沒有選擇手段。本策略通過僅依賴于編輯內源序列的單個步驟而不是編輯/插入新序列來避免該問題。作為hdr修復過程的一部分引入的dsb具有比堿基編輯更高的不期望的誘變事件的風險。

13、一個sgrna(或一組sgrna)可用于所有ctd突變

14、rtt?c端缺失是一組異質突變,其中許多單個缺失僅看到一次或少量次數(shù)。該策略靶向被認為存在于整個類別中的有問題的序列,從而使療法適用于約10%的rtt患者,與最常檢測到的錯義突變相當。

15、功能結構域應不受影響。

16、兩個關鍵功能結構域,mbd(甲基化dna結合結構域;a.a.78-162)和nid(ncor1/2相互作用結構域;a.a.301-309)不受ctd突變的影響。exac和gnomad數(shù)據(jù)顯示c端易缺失區(qū)非常耐受錯義突變和框內缺失。

17、crispr/cas系統(tǒng)的發(fā)現(xiàn)和廣泛實施已經顯著擴展了基因組工程的工具箱,并且已經徹底改革了基礎生物研究和醫(yī)學的未來前景。通過將脫氨酶結構域融合至cas9對腺嘌呤堿基編輯器的最近的開發(fā)使得向導rna?(grna)靶向的單核苷酸脫氨基作用能夠在特定靶窗口內使用腺嘌呤堿基編輯器將a:t堿基對轉化為g:c。堿基編輯在一系列物種(包括人合子)中具有高效率已被廣泛證明。

18、具有改善的dna編輯效率的不同的工程化堿基編輯器已被開發(fā)。例如,參考2018年3月15日公開的美國專利公開號2018/0073012;2017年5月4日公布的美國專利公開號2017/0121693;2017年4月27日公開的國際公開號wo2017/070633;和2015年6月18日公開的美國專利公開號2015/0166980;2017年12月12日公布的美國專利號9,840,699;和2018年9月18日公布的美國專利號10,077,453,其中的每一個通過以其全部內容并入本文。堿基編輯器(base?editor,be)可以是cas(“crispr相關的(crispr-associated)”)結構域和核堿基(或“堿基”)修飾結構域(例如,天然或進化的脫氨酶,諸如腺苷脫氨酶結構域)的融合體。在一些情況下,堿基編輯器還可包括影響細胞dna修復過程的蛋白質或結構域以提高所得單核苷酸變化的效率和/或穩(wěn)定性。

19、堿基編輯器通常含有與核堿基修飾結構域融合的催化受損的cas9結構域。cas9結構域指導核堿基修飾結構域在向導rna編程的靶位點處將一個堿基直接轉化為另一個堿基。迄今為止已經開發(fā)了兩個類別的堿基編輯器:將c*g轉換為t·a的胞嘧啶堿基編輯器(cbe)和將a·t轉換為g*c的腺嘌呤堿基編輯器(abe)。本公開涉及abe的用途。

20、abe(參見例如gaudelli等人,2017和richter等人,2020,本領域技術人員被引導至其,并且其全部內容通過引用并入本文)對于致病性等位基因的研究和校正尤其有用,因為原則上幾乎一半的致病性點突變可以通過將a·t堿基對轉化為g*c堿基對來校正。迄今為止報道的許多abe包括單多肽鏈(single?polypeptide?chain)和cas9(d10a)切口酶,所述單多肽鏈含有在堿基編輯期間起結構作用的野生型大腸桿菌(e.?coli)tada單體(ectada或tada)和催化脫氧腺苷脫氨基作用的實驗室進化的大腸桿菌(e.?coli)tada單體tada7.10(在本文中也稱為“tada*”)的異源二聚體。野生型大腸桿菌(e.?coli)tada充當同源二聚體以使位于trna反密碼子環(huán)中的腺苷脫氨基,產生肌苷(i)。盡管早期abe變體需要含有n端野生型tada單體的異源二聚體tada用于最大活性,但隨后的工作顯示,隨后的abe變體在有和沒有野生型tada單體的情況下具有相當?shù)幕钚浴?/p>

21、通過包括將增加dna特異性的突變安裝到堿基編輯器的cas9組分中、將5’鳥苷核苷酸添加至sgrna,或遞送作為核糖核蛋白(ribonucleoprotein,rnp)復合物的堿基編輯器的策略已經減少了向導rna-依賴性脫靶堿基編輯。向導rna-非依賴性脫靶編輯可以以cas9-非依賴性方式從堿基編輯器的脫氨酶結構域與c或a堿基的結合產生。

22、根據(jù)本公開的使用的abe可以包含融合蛋白,所述融合蛋白包含核酸dna結合蛋白(或napdnabp)結構域和腺苷脫氨酶結構域。napdnabp結構域可以包含cas9蛋白或其變體,例如cas9切口酶或具有改變的pam特異性的cas9切口酶。腺苷脫氨酶結構域可包含一個或多個腺苷脫氨酶。在某些教導中,腺苷脫氨酶結構域包含第一和第二腺苷脫氨酶的二聚體。二聚體可以是異源二聚體,其包含與第二腺苷脫氨酶不同的第一腺苷脫氨酶。第一腺苷脫氨酶可以位于第二腺苷脫氨酶的n端。在不同實施方案中,所述一個或多個腺苷脫氨酶通過接頭(例如,肽接頭)連接。

23、合適的abe可能能夠保持dna編輯效率,并且在一些實施方案中展示了相對于現(xiàn)有的腺嘌呤堿基編輯器(例如abe7.10)的改進的dna編輯效率,參見例如wo2020214842,其全部內容并入本文。wo2020214842描述了表現(xiàn)出降低的脫靶編輯效果同時保持高在靶(on-target)編輯效率的abe,以及richter(2020)、walton(2020)、gaudelli(2020)和chen(2022)中描述的更新的abe。

24、合適的abe可以與多種cas同源物兼容,所述cas同源物包括小尺寸、環(huán)狀置換的(circularly?permuted)和進化的cas同源物。

25、本公開包括組合物的用途,所述組合物包含abe(例如具有降低的脫靶效應(例如降低的rna編輯效果)的abe,例如包含ncas9結構域和腺苷脫氨酶結構域(例如第一和第二腺苷脫氨酶的異源二聚體)的融合蛋白)和一個或多個向導rna(例如單向導rna(“sgrna”))。

26、本公開進一步教導了編碼和/或表達如本文所述的腺嘌呤堿基編輯器及其腺苷脫氨酶結構域的核酸分子,以及用于表達本文所述的腺嘌呤堿基編輯器和grna(例如sgrna)的表達載體或構建體,包含所述核酸分子和表達載體以及一個或多個grna(例如sgrna)的細胞(例如宿主細胞),以及用于遞送和/或施用用于在mecp2的外顯子4中具有所述缺失的rtt受試者的細胞中表達的核酸分子的組合物,所述缺失導致到框(n+2)的移位??墒褂帽绢I域技術人員熟知的技術對核酸序列進行密碼子優(yōu)化以在人細胞中表達。

27、本說明書進一步教導了包含本文描述的腺嘌呤堿基編輯器和與融合蛋白的cas9結構域結合的grna(例如sgrna)的復合物。向導rna的長度可以是50-150個,例如90-100個或80-110個核苷酸,并且包含與靶核苷酸序列互補的至少10個、至少15個、或至少20個或25個連續(xù)核苷酸的序列。通常,所述序列的長度不超過30或35個核苷酸。

28、本公開進一步包括用于表達和/或轉導具有編碼融合蛋白和grna的表達構建體的細胞(如宿主細胞)的試劑盒。進一步教導了用于向宿主細胞施用表達的融合蛋白和表達的grna(例如sgrna)分子的試劑盒。本公開進一步教導穩(wěn)定或瞬時表達融合蛋白和grna(例如sgrna)或其復合物的宿主細胞。

29、由于本公開涉及rtt的治療,所述rtt是由于導致移碼(n+2)和末端為-pro-pro-stop的截短的mecp2序列的特定c端缺失而引起的,因此本教導還進一步包括首先針對此類c端移碼(n+2)缺失突變篩選rtt受試者,以便鑒定適合于根據(jù)本發(fā)明治療的受試者。本領域技術人員熟知可采用的合適的篩選技術,其包括受試者的mdcp2基因序列的核酸測序、pcr和其他擴增技術、使用合適探針的雜交技術等。

30、還教導了用本文所述的腺嘌呤堿基編輯器編輯本文所述的突變型mecp2基因(例如,突變型mecp2基因內的單個核堿基)的方法。這樣的方法涉及用多個復合物轉導(例如通過轉染)細胞,每個復合物包含融合蛋白(例如包含cas9切口酶(ncas9)結構域和腺苷脫氨酶結構域的融合蛋白)和grna(例如sgrna)分子。在某些實施方案中,所述方法涉及一個或多個核酸構建體(例如質粒、噬菌?;虿《据d體)的轉染,所述核酸構建體各自(或一起)編碼融合蛋白和grna(例如sgrna)分子的復合物的組分。在其他教導中,本文公開的方法可以涉及將包含融合蛋白和grna(例如sgrna)分子的復合物引入細胞中,所述復合物已經在這些細胞外部表達和克隆。根據(jù)本發(fā)明,使用病毒載體諸如腺相關病毒(adeno-associatedvirus,aav)載體(例如aav9)遞送至腦中的神經元是最合適的。然而,編碼合適的堿基編輯器的核酸可能太大,以至于不能適合單個病毒載體并被單個病毒載體表達。因此,在一個教導中,如本文所述,堿基編輯器可被編碼在兩個或更多個單獨的部分中,其可以通過蛋白質剪接重構為全長分子。這通過添加與待連接的序列相鄰的割裂的內含肽序列來促進(參見,例如,chen(2020))。

31、在一些實施方案中,提供了使用所公開的堿基編輯器治療rtt的方法,所述rtt是由于本文所述的突變型mecp2基因引起的。本文所述的方法可以包括治療患有rtt或有發(fā)生rtt風險的受試者,其包括向受試者(以有效量)施用本文所述的融合蛋白、本文所述的復合物、本文所述的多核苷酸、本文所述的載體或本文所述的藥物組合物。

32、定義

33、如本文和權利要求書中所使用的,單數(shù)形式“一個(a)”、“一個(an)”和“所述(the)”包括單數(shù)和復數(shù)指代,除非上下文另有明確地指示。因此,例如,對“試劑(anagent)”的指代包括單個試劑和多個這樣的試劑。

34、如本文所用,術語“腺苷脫氨酶結構域”是指包含一個或多個腺苷脫氨酶的融合蛋白內的結構域。例如,腺苷脫氨酶結構域可以包含通過接頭連接的第一腺苷脫氨酶和第二脫氨酶結構域的異源二聚體,或單個工程化的腺苷脫氨酶結構域。

35、“堿基編輯”是指基因組編輯技術,所述基因組編輯技術涉及將靶向的基因組基因座處的特定核酸堿基轉化為另一個核酸堿基。在某些實施方案中,這可以在不需要雙鏈dna斷裂(dsb)或單鏈斷裂(即切口)的情況下實現(xiàn)。其他基因組編輯技術(包括基于crispr的系統(tǒng)),開始于在目的基因座處引入dsb。隨后,細胞dna修復酶修復斷裂,通常導致dsb的位點處堿基的隨機插入或缺失(插入/缺失)(indel)。然而,當期望在靶基因座處引入或校正點突變,而不是整個基因的隨機破壞時,這些基因組編輯技術是不合適的,因為校正率低(例如,通常為0.1%至5%),主要基因組編輯產物是插入/缺失。為了提高基因校正的效率而不同時引入隨機插入/缺失,crispr/cas9系統(tǒng)已經被修飾為直接將一個dna堿基轉化為另一個dna堿基而無dsb形成。參見komor,a.c.等人,programmable?editing?of?a?target?basein?genomic?dna?without?double-bridged?dna?cleavage.nature533,420-424(2016),通過引用以其全部內容并入本文。

36、“堿基編輯構建體”是指用于堿基編輯的系統(tǒng),所述系統(tǒng)包含合適的酶和任選地能夠結合靶核酸的核酸。

37、“腺嘌呤堿基編輯器”(或“abe”)。這種編輯器將a:t?watson-crick核堿基對轉化為g:c?watson-crick核堿基對。因為相應的watson-crick配對的堿基由于轉換也互換,所以該類別的堿基編輯器也可被稱為胸腺嘧啶堿基編輯器(thymine?base?editor)(或“tbe”)。

38、如本文所用,術語“堿基編輯器(base?editor)”(或“be”)是指包含多肽的試劑,所述多肽能夠對核酸序列(例如,dna或rna)內的堿基(例如,a、t、c、g或u)進行修飾。在一些實施方案中,堿基編輯器能夠使核酸內的堿基(例如dna分子內的堿基)脫氨基。

39、在腺嘌呤堿基編輯器的情況下,堿基編輯器能夠使dna中的腺嘌呤(a)脫氨基。這樣的堿基編輯器可以包括與腺苷脫氨酶融合的核酸可編程dna結合蛋白(napdnabp)。一些堿基編輯器包括在本文所述的堿基編輯方法中使用的crispr介導的融合蛋白。在一些實施方案中,堿基編輯器包含與脫氨酶融合的核酸酶無活性的cas9(dcas9),所述核酸酶無活性的cas9通過r環(huán)的形成以向導rna編程的方式結合核酸,但不切割核酸。例如,融合蛋白的dcas9結構域可以包括d10a和h840a突變(其使得cas9能夠僅切割核酸雙鏈體的一條鏈),如wo2017/070632中所述并且其全部內容通過引用并入本文?;撔枣溓蚓╯.?pyogenes)cas9的dna切割結構域包括兩個亞結構域,hnh核酸酶亞結構域和ruvcl亞結構域。hnh亞結構域切割與grna互補的鏈(“靶向鏈”,或其中發(fā)生編輯或脫氨基作用的鏈),而ruvcl亞結構域切割含有pam序列的非互補鏈(“未編輯鏈”)。ruvcl突變體d10a在靶向鏈中產生切口,而hnh突變體h840a在未編輯的鏈上產生切口(參見jinek等,?science,337:816-821(2012);qi等,cell.?28;?152(5):?1173-83?(2013))。

40、術語“堿基編輯器”包含在本文所述的多重堿基編輯方法中使用的crispr介導的融合蛋白以及在本技術提交時本領域已知或描述的或將來開發(fā)的任何堿基編輯器。參考rees?&?liu,base?editing:precision?chemistry?on?the?genome?and?transcriptomeof?living?cells,nat.?rev.?genet.?2018;19(12):770-788;以及美國專利公開號2018/0073012;美國專利公開號2017/0121693;國際公開號wo2017/070633;美國專利公開號2015/0166980;國際公開號wo2017/070633;國際公開號wo2018/027078;國際公開號wo2019/079347;國際公開號wo2019/226593;美國專利公開號2015/0166980;美國專利號10,077,453;國際公開號wo2019/023680;國際公開號wo2018/0176009;國際公開號wo2020051360;國際公開號wo2020102659;國際公開號wo202086908;和國際公開號wo2020214842,其中的每一個的內容通過引用以其整體并入本文。

41、術語“cas9”或“cas9核酸酶”或“cas9結構域”是指crispr相關蛋白9或其變體,并且包括來自任何生物體的任何天然存在的cas9、任何天然存在的cas9等同物或其片段、來自任何生物體的任何cas9同源物、直向同源物(ortholog)或橫向同源物(paralog),以及天然存在或改造的cas9的任何變體。因此,術語cas9擴展到已經開發(fā)的緊湊(compact)cas9變體,例如nme2變體(參見erdaki等人,2019)。

42、術語cas9不意味著是特別限制性的,并且可以被稱為“cas9或其變體”。示例性cas9蛋白在本文中描述并且也在本領域中描述。本公開不受限制于關于特定cas9,所述特定cas9是在本公開中使用的crispr介導的融合蛋白中使用的。

43、在一些實施方案中,包含cas9或其片段的蛋白質被稱為“cas9變體”。cas9變體與cas9或其片段具有同源性。cas9變體包括cas9的功能片段。例如,cas9變體與野生型cas9具有至少約70%同一性、至少約80%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。在一些實施方案中,與野生型cas9相比,cas9變體可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多個氨基酸變化。在一些實施方案中,cas9變體包含cas9的片段(例如grna結合結構域或dna-切割結構域),使得片段與野生型cas9的相應片段具有至少約70%同一性、至少約80%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。

44、在一些實施方案中,片段是相應野生型cas9的氨基酸長度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%同一性、至少96%、至少97%、至少98%、至少99%或至少99.5%。

45、如本文所使用的,術語“dcas9”是指核酸酶無活性的cas9或核酸酶死亡的cas9或其變體,并且包括來自任何生物體的任何天然存在的dcas9、任何天然存在的dcas9等同物或其功能片段、來自任何生物體的任何dcas9同源物、直向同源物(ortholog)或橫向同源物(paralog),以及天然存在或改造的dcas9的任何變體。術語dcas9不意味著是特別限制性的,并且可以被稱為“dcas9或其變體”。示例性dcas9蛋白和用于制備dcas9蛋白的方法在本文中進一步描述和/或本領域中描述并且通過引用并入本文。使兩種cas9核酸內切酶失活的任何合適的突變,例如野生型化膿性鏈球菌(s.?pyogenes)cas9氨基酸序列中的d10a和h840a突變,或野生型金黃色葡萄球菌(s.?aureus)cas9氨基酸序列中的d10a和n580a突變,可以用于形成dcas9。

46、如本文所用,術語“ncas9”或“cas9切口酶”是指cas9或其變體,其僅切割靶切割位點的鏈中的一個或僅使靶切割位點的鏈中的一個有切口,從而在雙鏈dna分子中引入切口而不是產生雙鏈斷裂。這可以通過在野生型cas9中引入適當?shù)耐蛔儊韺崿F(xiàn),從而使cas9的兩種核酸內切酶活性之一失活。任何合適的使一種cas9核酸內切酶活性失活但使另一種完整的突變被考慮,例如野生型化膿性鏈球菌(s.?pyogenes)cas9氨基酸序列中的d10a或h840a突變之一,或野生型金黃色葡萄球菌(s.?aureus)cas9氨基酸序列中的d10a突變,可被用于形成ncas9。

47、“crispr”是細菌和古細菌中的dna序列家族(即,crispr簇),其代表已經侵入原核生物的病毒的先前感染的切下的片段(snippet)。dna的切下的片段被原核細胞用于檢測和破壞來自類似病毒的后續(xù)攻擊的dna,并且與一系列的crispr相關蛋白(包括cas9及其同源物)和crispr相關rna一起有效地構成原核免疫防御系統(tǒng)。在自然界中,crispr簇被轉錄并加工成crispr?rna(crrna)。在某些類型的crispr系統(tǒng)(例如ii型crispr系統(tǒng))中,前crrna(pre-crrna)的正確加工需要反式編碼的小rna(trans-encoded?small?rna,tracrrna)、內源核糖核酸酶3(me)和cas9蛋白。tracrrna用作前crrna的核糖核酸酶3輔助加工的向導。隨后,cas9/crrna/tracrrna以內切核苷酸方式切割與rna互補的線性或環(huán)狀核酸靶標。具體地,與crrna不互補的靶鏈首先以內切核苷酸方式被切割,然后3'-5'以外切核苷酸方式被修剪。在自然界中,dna結合和切割通常需要蛋白質和兩種rna。然而,單向導rna(“sgrna”或簡稱“grna”)可被工程化,以便將crrna和tracrrna兩者的實施方案并入單個rna種類(species)-向導rna中。參見例如jinek?m.等人,science?337:816-821(2012),通過引用將其全部內容并入本文。cas9識別crispr重復序列中的短基序(pam或原間隔區(qū)臨近基序)以幫助區(qū)分自身與非自身。crispr生物學以及cas9核酸酶序列和結構是本領域技術人員熟知的(參見,例如,“complete?genome?sequence?of?an?mi?strain?of?streptococcuspyogenes.”ferretti?j.j.等,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrna?maturation?by?trans-encoded?small?rna?and?host?factor?rnase?iii.”deltcheva?e.等人,nature?471:602-607(2011);和“a?programmable?dual-rna-guideddna?enucleogenate?in?adaptive?bacterial?immunity.”?jinek?m.等人,science337:816-821(2012),通過引用以其各自的全部內容并入本文)。cas9直向同源物(ortholog)已經被描述在不同物種中,包括但不限于化膿性鏈球菌(s.?pyogenes)、嗜熱鏈球菌(s.thermophiles)、潰瘍棒狀桿菌(c.?ulcerans)、白喉鏈球菌(s.?diphtheria)、梅毒螺原體(s.syrphidicola)、中間普雷沃菌(p.?intermedia)、臺灣螺原體(s.?taiwanense)、海豚鏈球菌(s.?iniae)、波羅的海貝爾氏菌(b.?baltica)、扭曲冷彎曲菌(p.?torquis)、嗜熱鏈球菌(s.?thermophilus)、無害李斯特菌(l.?innocua)、空腸彎曲桿菌(c.?jejuni)和腦膜炎奈瑟球菌(n.?meningitidis)?;诒竟_,另外的合適的cas9核酸酶和序列對于本領域技術人員將是顯而易見的,并且這樣的cas9核酸酶和序列包括在chylinski、rhun和charpentier,“the?tracrrna?and?cas9?families?of?type?ii?crispr-c?as?immunitysystems”(2013)?rna?biology?10:5,726-737中公開的來自生物體的cas9序列和基因座,其全部內容通過引用并入本文。對本領域技術人員有所指導的的其他相關教導以及通過引用并入本文的全部內容包括kleinstiver(2016)、slaymaker(2015)和vakulskas(2018)。

48、術語“脫氨酶”或“脫氨酶結構域”是指催化脫氨基作用反應的蛋白質或酶。根據(jù)本公開,脫氨酶是腺苷脫氨酶,其催化腺嘌呤或腺苷的水解脫氨基作用。在一些實施方案中,腺苷脫氨酶催化脫氧核糖核酸(dna)中的腺苷水解脫氨基作用為肌苷(并且因此腺嘌呤堿基轉化為次黃嘌呤堿基)。本文提供的脫氨酶可以來自任何生物體,例如細菌。在一些實施方案中,脫氨酶或脫氨酶結構域是來自生物體的天然存在的脫氨酶的變體。在一些實施方案中,脫氨酶或脫氨酶結構域不存在于自然界中。例如,在一些實施方案中,脫氨酶或脫氨酶結構域與天然存在的脫氨酶具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。

49、本文提供的腺苷脫氨酶(例如改造的腺苷脫氨酶、進化的腺苷脫氨酶)可以是將dna或rna中的腺苷(a)轉化為肌苷(i)的酶。這種腺苷脫氨酶可導致a:t至g:c堿基對的轉化。在一些實施方案中,脫氨酶是來自生物體的天然存在的脫氨酶的變體。在一些實施方案中,脫氨酶不存在于自然界中。例如,在一些實施方案中,脫氨酶與天然存在的脫氨酶具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。

50、在一些實施方案中,腺苷脫氨酶源自細菌,如大腸桿菌(e.coli)、金黃色葡萄球菌(s.?aureus)、鼠傷寒沙門氏菌(s.?typhi)、腐敗希瓦氏菌(s.?putrefaciens)、流感嗜血桿菌(h.?influenzae)或新月柄桿菌(c.?crescentus)。在一些實施方案中,腺苷脫氨酶是tada脫氨酶。在一些實施方案中,tada脫氨酶是大腸桿菌tada脫氨酶(ectada)。在一些實施方案中,tada脫氨酶是截短的大腸桿菌tada脫氨酶。例如,相對于全長ectada,截短的ectada可能缺失一個或多個n端氨基酸。在一些實施方案中,相對于全長ectada,截短的ectada可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20個n端氨基酸殘基。在一些實施方案中,相對于全長ectada,截短的ectada可能缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19或20個c端氨基酸殘基。在一些實施方案中,ectada脫氨酶不包含n端甲硫氨酸。參考美國專利公開號2018/0073012,通過引用以其全部內容并入本文。

51、如本文所用,術語“dna結合蛋白”或“dna結合蛋白結構域”是指定位并結合特定靶dna核苷酸序列(例如基因組的基因座)的任何蛋白。該術語包括rna可編程蛋白質,其與一個或多個核酸分子(即,其包括例如在cas系統(tǒng)的情況下的向導rna)締合(例如形成復合物),所述核酸分子指導或以其他方式對蛋白質進行編程以定位到特定的靶核苷酸序列(例如dna序列),所述靶核苷酸序列與和蛋白質締合的一個或多個核酸分子(或其部分或區(qū)域)互補。示例性rna-可編程蛋白是crispr-cas9蛋白,以及cas9等同物、同源物、直向同源物(homologs)、或橫向同源物(orthologs),無論是天然存在的還是非天然存在的(例如改造的或修飾的),并且可以包括來自任何類型的crispr系統(tǒng)(例如ii型、v型、vi型)的cas9等同物,包括casl2a(v型crispr-cas系統(tǒng))(原先被稱為cpfl)、c2cl(v型crispr-cas系統(tǒng))、c2c2(vi型crispr-cas系統(tǒng))、c2c3(v型crispr-cas系統(tǒng))、geocas9、cjcas9、casl2b、casl2g、casl2h、casl2i、casl3b、casl3c、casl3d、casl4、csn2、xcas9、spcas9-ng、cas9-kkh、環(huán)狀置換的cas9、argonaute(ago)、smaccas9或spy-maccas9。在makarova等人的“c2c2is?asingle-component?programmable?rna-guided?rna-targeting?crispr?effector,”science2016;353(6299)中描述了其他的cas等同物,其內容通過引用并入本文。

52、如本文所用,術語“dna編輯效率”是指被編輯的預期堿基對的數(shù)量或比例。例如,如果堿基編輯器編輯了其旨在靶向的堿基對的10%?(例如,在細胞內或在細胞群體內),則堿基編輯器可被描述為10%有效。編輯效率的一些方面包括dna內特定核苷酸的修飾(例如脫氨基作用),而不產生大量或大百分比的插入或缺失(即插入/缺失)。通常接受的是,當產生小于5%的插入/缺失(?(如在總的靶核苷酸底物上測量的)時,編輯是高編輯效率。產生超過20%插入/缺失通常被認為是不良或低編輯效率。插入/缺失形成可以通過本領域已知的技術測量,包括測序讀數(shù)的高通量篩選。

53、如本文所用,術語“脫靶編輯頻率”是指非預期堿基對(例如經編輯的dna堿基對)的數(shù)量或比例。在靶和脫靶編輯頻率可通過本文所述的方法和測定來測量,進一步鑒于本領域已知的技術,包括高通量測序讀取。如本文所用,高通量測序涉及核酸引物(例如,dna引物)與目的靶序列或脫靶序列的僅上游或下游的核酸(例如,dna)區(qū)域互補性的的雜交。因為dna靶序列和cas9非依賴性脫靶序列在本文公開的方法中是先驗已知的,所以可以使用本領域已知的技術,例如phusionu?pcr試劑盒(fife?technologies)、phusion?hs?ii試劑盒(fife?technologies)和illumina?miseq試劑盒,設計與目的靶序列和cas9非依賴性脫靶序列上游或下游的區(qū)域具有足夠互補性的核酸引物。由于許多cas9依賴性脫靶位點與目的靶位點具有高序列同一性,因此與cas9依賴性脫靶位點上游或下游的區(qū)域具有足夠互補性的核酸引物同樣可以使用本領域已知的技術和試劑盒設計。這些試劑盒利用聚合酶鏈式反應(polymerase?chain?reaction,pcr)擴增,其產生擴增子作為中間產物。靶序列和脫靶序列可包含基因組基因座,所述基因組基因座進一步包含原間隔區(qū)和pam。

54、因此,如本文所用,術語“擴增子”可指構成基因組基因座、原間隔區(qū)和pam的聚集體的核酸分子。本文使用的高通量測序技術可進一步包括sanger測序和/或全基因組測序(whole?genome?sequencing,wgs)。

55、如本文所用,術語“rna編輯活性”、“rna編輯效果”和“rna脫靶編輯”是指將修飾(例如脫氨基作用)引入細胞rna(例如信使rna(mrna))內的核苷酸。dna堿基編輯效率的重要目標是dna內特定核苷酸的修飾(例如脫氨基作用),而不引入rna內類似核苷酸的修飾。當檢測到的突變以0.3%或更小的頻率引入rna分子時,rna編輯效果是“低”或“降低的”。作為參考,abemax堿基編輯器將編輯以大約0.50%的頻率引入到rna中。當在分析的mrna轉錄組內以小于約70,000次編輯的量值檢測到突變時,rna編輯效果為“低”或“降低的”。rna編輯的數(shù)量可以通過本領域已知的技術來測量,包括測序讀數(shù)和rna-seq的高通量篩選。rna編輯對從經編輯的mrna轉錄物翻譯的蛋白的功能的影響可以通過使用sift(“sortingintolerant?from?tolerant”)算法來預測,該算法基于氨基酸的序列同源性和物理性質的預測。

56、如本文所用,術語“在靶編輯”是指使用本文所述的堿基編輯器將預期修飾(例如,脫氨基作用)引入靶序列中的核苷酸(例如,腺嘌呤)。如本文所用,術語“脫靶dna編輯”是指在規(guī)范的堿基編輯器結合窗口之外的序列中(即,從一個原間隔區(qū)位置到另一個,通常為2至8個核苷酸長)的核苷酸(例如腺嘌呤)中引入非預期修飾(例如脫氨基作用)。脫靶dna編輯可以由grna序列與靶序列的弱或非特異性結合產生。描述減少脫靶編輯的方式的示例性教導(其全部內容通過引用并入本文)可以在grunwald(2019)和rees(2019)中找到。

57、如本文所用,術語“有效量”是指足以引發(fā)所需生物反應的生物活性劑的量。例如,在一些實施方案中,組合物的有效量可以指足以編輯核苷酸序列(例如基因組)的靶位點的組合物的量。在一些實施方案中,本文提供的組合物(例如包含核酸酶無活性的cas9結構域、脫氨酶結構域、grna和任選地生長因子和抗凋亡因子的組合物)的有效量,可以指足以誘導被融合蛋白特異性結合和編輯的靶位點的編輯的組合物的量。在一些實施方案中,本文提供的組合物的有效量可以指足以誘導具有以下特征的編輯的組合物的量:>50%產品純度;<5%插入/缺失;和2-8個核苷酸的編輯窗口。如本領域技術人員將理解的,藥劑(agent)(例如組合物或融合蛋白-grna復合物)的有效量可以根據(jù)不同因素而變化,例如取決于期望的生物反應,例如取決于待編輯的特定等位基因、基因組或靶點,取決于所靶向的細胞或組織,以及取決于所使用的藥劑。

58、術語“進化的堿基編輯器”或“進化的堿基編輯器變體”是指由于誘變處理參照堿基編輯器或起點(starting-point)堿基編輯器而形成的堿基編輯器。該術語是指核堿基修飾結構域進化或單獨結構域進化的實施方案。誘變處理參照堿基編輯器或起點堿基編輯器可包括誘變處理腺苷脫氨酶。氨基酸序列變異可包括參考堿基編輯器的氨基酸序列內的一個或多個突變殘基,例如,作為編碼堿基編輯器的核苷酸序列的改變的結果,其導致編碼序列中任何特定位置處的密碼子改變、一個或多個氨基酸的缺失(例如,截短蛋白)、一個或多個氨基酸的插入或前述的任何組合。進化的堿基編輯器可以包括堿基編輯器的一個或多個組分中或結構域中的變體(例如,引入一個或多個腺苷脫氨酶的變體)。

59、如本文所用,術語“融合蛋白”是指雜合多肽,其包含來自至少兩種蛋白質的蛋白結構域。一種蛋白質可以位于融合蛋白的氨基端(n端)部分或羧基末端(c端)蛋白,從而分別形成“氨基末端融合蛋白”或“羧基末端融合蛋白”。蛋白質可以包含不同的結構域,例如核酸結合結構域(例如指導蛋白質與靶位點結合的cas9的grna結合結構域)和核酸編輯蛋白的核酸切割結構域或催化結構域。本文提供的任何蛋白質可以通過本領域已知的任何方法制備。例如,本文提供的蛋白可以通過重組蛋白表達和純化制備,這尤其適用于包含肽接頭的融合蛋白。用于重組蛋白表達和純化的方法是眾所周知的,并且包括由green和sambrook,?molecular?cloning:a?laboratory?manual(第四版,cold?spring?harborlaboratory?press,cold?spring?harbor,ny(2012))描述的那些,其全部內容通過引用并入本文。

60、如本文所用,術語“宿主細胞”是指可以承載(host)、復制和轉移如本文所討論的核酸或載體的細胞。在載體是病毒載體的實施方案中,合適的宿主細胞是可以被病毒載體感染,可以復制病毒載體,并且可以將病毒載體包裝成能夠感染新鮮宿主細胞的病毒顆粒的細胞。如果細胞支持病毒載體基因的表達、病毒基因組的復制和/或病毒顆粒的產生,則它可以承載(host)病毒載體。確定細胞是否是給定病毒載體的合適宿主細胞的一個標準是確定細胞是否可以支持病毒載體所源自的野生型病毒基因組的病毒生命周期。例如,如果病毒載體是經修飾的m13噬菌體基因組,如本文所述的一些實施方案中所提供的,則合適的宿主細胞將是可支持野生型m13噬菌體生命周期的任何細胞??捎糜谶B續(xù)進化過程的病毒載體的合適宿主細胞是本領域技術人員熟知的,并且本公開在這方面不受限制。在一些實施方案中,病毒載體是噬菌體,宿主細胞是細菌細胞。在一些實施方案中,宿主細胞是大腸桿菌細胞。

61、合適的大腸桿菌宿主菌株對于本領域技術人員將是顯而易見的,并且包括但不限于new?england?biolabs(neb)turbo、toplof’、dh12s、er2738、er2267和xll-blue?mrf’。這些菌株名稱是公認的,并且這些菌株的基因型已經被充分表征。如本文所用,術語“新鮮的”在宿主細胞的上下文中可與術語“未感染的(non-?infected)”或“未感染的(uninfected)”互換,是指尚未被病毒載體感染的宿主細胞,所述病毒載體包含如本文提供的連續(xù)進化過程中使用的目的基因。然而,新鮮的宿主細胞可能已經被與待進化的載體無關的病毒載體或被相同或相似類型但不攜帶目的基因的載體感染。

62、在一些實施方案中,宿主細胞是原核細胞,例如細菌細胞。在一些實施方案中,宿主細胞是大腸桿菌(e.?coli)細胞。在一些實施方案中,宿主細胞是真核細胞,例如酵母細胞、昆蟲細胞或哺乳動物細胞。當然,宿主細胞的類型將取決于所用的病毒載體,并且合適的宿主細胞/載體組合對于本領域技術人員將是顯而易見的。

63、由于雷特綜合征是影響腦運作方式的神經系統(tǒng)疾病,宿主細胞可以是神經細胞,諸如神經元,例如興奮性或抑制性神經元,或神經膠質細胞,諸如星形膠質細胞和小膠質細胞。

64、如本文所用,術語“接頭”是指連接兩個分子或結構域(例如dcas9和脫氨酶)的化學基團或分子。通常,接頭位于兩個基團、分子或其他結構域之間或兩側,并且通過共價鍵連接至每個基團、分子或其他結構域,從而連接兩者。在一些實施方案中,接頭是氨基酸或多個氨基酸(例如肽或蛋白質)。在一些實施方案中,接頭是有機分子、基團、聚合物或化學結構域?;瘜W基團包括但不限于二硫化物、腙和疊氮化物結構域。在一些實施方案中,接頭長度為5-100個氨基酸,例如長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200個氨基酸。更長或更短的接頭也被考慮。在一些實施方案中,接頭是xten接頭。

65、如本文所用,術語“低毒性”是指在應用本文公開的堿基編輯方法或施用本文公開的組合物后,細胞群體保持高于60%的活力。該術語還可以指預防超過40%的細胞群體的凋亡(細胞死亡)。例如,導致小于30%(例如25%、20%、15%、10%或5%)細胞死亡的基因組編輯方法表現(xiàn)出低毒性。細胞毒性可以通過適當?shù)娜旧珳y定(例如膜聯(lián)蛋白v和碘化丙啶染色測定)以及隨后的流式細胞術(例如facs)評估。

66、如本文所用,術語“突變”是指用另一殘基置換序列(例如核酸或氨基酸序列)內的殘基;缺失或插入序列內的一個或多個殘基;或置換待校正受試者的基因組序列內的殘基。在本文中通常通過鑒定原始殘基,然后鑒定序列內殘基的位置和鑒定新置換的殘基的同一性來描述突變。本文提供的用于制備氨基酸置換(突變)的不同方法是本領域熟知的,并且由例如green和sambrook,molecular?cloning:a?laboratory?manual(第四版,coldspring?harbor?laboratory?press,cold?spring?harbor,n.y.(2012))提供。突變可以包括多種類別,例如單堿基多態(tài)性、微復制區(qū)域、插入/缺失和倒位,并且不意味著以任何方式進行限制。突變可以包括“功能喪失”突變,其是降低或消除蛋白質活性的突變的結果。大多數(shù)功能缺失突變是隱性的,因為在雜合子中,第二染色體拷貝攜帶用于完全功能蛋白(fully?functional?protein)的基因編碼的未突變版本,所述完全功能蛋白的存在補償突變的影響。存在一些例外,其中功能喪失突變是顯性的,一個示例是單倍劑量不足(haploinsufficiency),其中生物體不能耐受雜合子所遭受的蛋白質活性的約50%降低。這是對人類幾種遺傳疾病的解釋,包括馬凡綜合征(marfan?syndrome),其由稱為微纖維蛋白的結締組織蛋白的基因突變引起。

67、在本公開的上下文中,“翻譯通讀”是編輯tga終止密碼子的第三個堿基的結果,使得所得密碼子不再編碼終止密碼子,并且翻譯可以繼續(xù)直到下一個終止密碼子出現(xiàn)。

68、術語“非天然存在的”或“改造的”可互換使用,并且指示人類之手的參與。當提及核酸分子或多肽(例如脫氨酶)時,這些術語是指核酸分子或多肽至少基本上不含至少一種與它們在自然界中天然地締合和/或如自然界中發(fā)現(xiàn)的其他組分(例如未在自然界中發(fā)現(xiàn)的氨基酸序列)。

69、如本文所用,術語“核酸”是指rna以及單鏈和/或雙鏈dna。核酸,例如,在基因組的背景下,可以是天然存在的轉錄物、mrna、trna、rrna、sirna、snrna、質粒、粘粒、染色體、染色單體或其他天然存在的核酸分子。另一方面,核酸分子可以是非天然存在的分子,例如重組dna或rna、人工染色體、改造的基因組或其片段,或合成的dna、rna、dna/rna雜合體(hybrid),或包括非天然存在的核苷酸或核苷。此外,術語“核酸”、“dna”、“rna”和/或類似術語包括核酸類似物,例如具有不同于磷酸二酯骨架的類似物。核酸可以從天然來源純化,使用重組表達系統(tǒng)產生,并且任選地純化、化學合成等。在適當?shù)那闆r下,例如在化學合成分子的情況下,核酸可以包含核苷類似物,例如具有化學修飾的堿基或糖以及骨架修飾的類似物。除非另有說明,核酸序列以5’至3’方向存在。在一些實施方案中,核酸是或包含天然核苷(例如腺苷、胸苷、鳥苷、胞苷、尿苷、脫氧腺苷、脫氧胸苷、脫氧鳥苷和脫氧胞苷);核苷類似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脫氮腺苷、7-脫氮鳥苷、肌苷腺苷(inosinedenosine)、8-氧代鳥苷、o(6)-甲基鳥嘌呤及2-硫代胞苷);化學修飾的堿基;生物修飾的堿基(例如甲基化的堿基);嵌入堿基(intercalated?base));修飾的糖(例如2’-氟代核糖(2’-fluororibose)、核糖、2’-脫氧核糖、阿拉伯糖和己糖);和/或修飾的磷酸酯基團(例如硫代磷酸酯和5’-n-亞磷酰胺鍵)。

70、如本文用于修飾向導rna分子,術語“骨架”是指包含核心區(qū)域的向導rna的組分,也稱為crrna/tracrrna。骨架與向導序列或間隔區(qū)(向導rna的與核酸分子的原間隔區(qū)具有互補性的區(qū)域)分開。

71、術語“核酸可編程dna結合蛋白(napdnabp)”是指可以與一個或多個核酸分子(即,其可被廣泛地稱為“napdnabp編程核酸分子”,并且包括例如在cas系統(tǒng)的情況下的向導rna)締合(例如,形成復合物)的任何蛋白,所述核酸分子指導或以其他方式對蛋白進行編程以定位到與和蛋白締合的一個或多個核酸分子(或其部分或區(qū)域)互補的特定靶核苷酸序列(例如,基因組的基因座),從而使蛋白結合到特定靶位點處的核苷酸序列。該術語napdnabp包括crispr-cas9蛋白,以及cas9等同物、同源物、直向同源物(orthologs)或橫向同源物(paralogs),無論是天然存在的還是非天然存在的(例如改造的或修飾的),并且可以包括來自任何類型的crispr系統(tǒng)(例如ii、v、vi型)的cas9等同物,包括casl2a(v型crispr-cas系統(tǒng))(先前稱為cpfl)、c2cl(v型crispr-cas系統(tǒng))、c2c2(vi型crispr-cas系統(tǒng))、c2c3(v型crispr-cas系統(tǒng))、geocas9、cjcas9、cas12b、casl2g、casl2h、casl2i、casl3b、casl3c、casl3d、casl4、csn2、xcas9、spcas9-ng、cas9-kkh、環(huán)狀置換的cas9、argonaute(ago)、smaccas9或spy-maccas9。napdnabp可以是包含核酸酶活性cas9結構域、核酸酶非活性cas9(dcas9)結構域或cas9切口酶(ncas9)結構域的cas9結構域。進一步的cas等同物在makarova等人的“c2c2is?a?single-component?programmable?rna-guidedrna-targeting?crispr?effector,”science2016;353(6299)中描述,其內容通過引用并入本文。然而,可結合本公開使用的核酸可編程dna結合蛋白(napdnabp)不限于crispr-cas系統(tǒng)。要求保護的發(fā)明包括任何這樣的可編程蛋白,例如來自格氏嗜鹽堿桿菌(natronobacterium?gregoryi)(ngago)的argonaute蛋白,其也可以用于dna向導的基因組編輯。ngago-向導dna系統(tǒng)不需要pam序列或向導rna分子,這意味著基因組編輯可以簡單地通過通用ngago蛋白的表達和合成寡核苷酸在任何基因組序列上的引入來進行。參見gao等人,dna-guided?genome?editing?using?the?natronobacterium?gregoryiargonaute.nature?biotechnology?2016;?34(7):768-73,其通過引用并入本文。

72、在一些實施方案中,napdnabp是rna可編程核酸酶,當與rna為復合物時,可以被稱為核酸酶:rna復合物。通常,結合的一個或多個rna被稱為向導rna(grna)。grna可以作為兩個或更多個rna的復合物存在,或者作為單個rna分子。作為單個rna分子存在的grna可以被稱為單向導rna?(sgrna),盡管“grna”被互換使用以指代作為單個分子或作為兩個或更多個分子的復合物存在的向導rna。通常,作為單個rna種類存在的grna包含兩個結構域:(1)與靶核酸共享同源性(例如,并且引導cas9(或等同物)復合物與靶的結合)的結構域;和(2)結合cas9蛋白的結構域。在一些實施方案中,結構域(2)對應于稱為tracrrna的序列,并且包含莖環(huán)結構。例如,在一些實施方案中,結構域(2)與tracrrna同源,如jinek等人,science337:816-821(2012)的圖ie中所述,通過引用將其全部內容并入本文。grna的其他示例(例如,包括結構域2的那些)可以在標題為“mrna-sensing?switchable?grnas”的美國專利號9,340,799和標題為“delivery?system?for?functional?nucleases”的wo?2015/035136中找到,通過引用將其每個的全部內容并入本文。在一些實施方案中,grna包含兩個或更多個結構域(1)和(2),并且可以被稱為“延伸的grna”。例如,延伸的grna將例如結合兩個或更多個cas9蛋白并且在兩個或更多個不同區(qū)域結合靶核酸,如本文所述。grna包含與靶位點互補的核苷酸序列,其介導核酸酶/rna復合物與所述靶位點的結合,提供核酸酶:rna復合物的序列特異性。在一些實施方案中,rna可編程核酸酶是(crispr相關系統(tǒng))cas9核酸內切酶,例如來自化膿性鏈球菌(streptococcus?pyogenes)的cas9?(csnl)(參見,例如,“complete?genome?sequence?of?an?mi?strain?of?streptococcus?pyogenes.”ferretti?j.j.等,?proc.?natl.?acad.?sci.?u.s.a.98:4658-4663(2001);“crispr?rnamaturation?by?trans-encoded?small?rna?and?host?factor?rnase?iii”。deltcheva?e.等人,nature471:602-607(2011);和“a?programmable?dual-rna-guided?dnaendonuclease?in?adaptive?bacterial?immunity.”?jinek?m.等人,science337:816-821(2012),通過引用將其每一個的全部內容并入本文。

73、napdnabp核酸酶(例如cas9)使用rna:dna雜交來靶向dna切割位點,原則上這些蛋白質能夠由向導rna指定的任何序列靶向。使用napdnabp核酸酶如cas9進行位點特異性切割(例如,修飾基因組)的方法是本領域已知的(參見例如,cong,l.等人,multiplex?genomeengineering?using?crispr/cas?systems.?science?339,?819-823(2013);mali,p.等人,rna-guided?human?genome?engineering?via?cas9.?science?339,?823-826?(2013);hwang,w.y.等人,efficient?genome?editing?in?zebrafish?using?a?crispr-cassystem.?nature?biotechnology?31,?227-229(2013);jinek,m.等人,rna-programmedgenome?editing?in?human?cells.?elife?2,?e00471?(2013);dicarlo,j.e.等,genomeengineering?in?saccharomyces?cerevisiae?using?crispr-cas?systems.?nucleicacid?res.(2013);jiang,w.等人,rna-guided?editing?of?bacterial?genomes?usingcrispr-c?as?systems.?nature?biotechnology?31,?233-239?(2013);通過引用將其每一個的全部內容并入本文)。

74、術語“napdnabp-編程核酸分子”或等同地“向導序列”是指一個或多個核酸分子,其與napdnabp蛋白締合并指導或以其他方式編程napdnabp蛋白,以定位到與和該蛋白締合的一個或多個核酸分子(或其部分或區(qū)域)互補的特定靶核苷酸序列(例如基因組的基因座),從而使napdnabp蛋白結合特定靶位點處的核苷酸序列。非限制性示例是crispr-cas基因組編輯系統(tǒng)的cas蛋白的向導rna。

75、術語“啟動子”是本領域公認的,并且是指具有由細胞轉錄機器識別的序列并且能夠啟動下游基因的轉錄的核酸分子。啟動子可以是組成型活性的,這意味著啟動子在給定的細胞環(huán)境中總是活性的,或者是條件活性的,這意味著啟動子僅在特定條件存在下是活性的。例如,條件啟動子可僅在存在將與啟動子中的調節(jié)元件相關的蛋白連接與基本轉錄機制連接的特定蛋白的下具有活性,或僅在不存在抑制性分子的情況下具有活性。條件活性啟動子的亞類是誘導型啟動子,其需要用于活性的小分子“誘導物”的存在。

76、誘導型啟動子的示例包括但不限于阿拉伯糖誘導型啟動子、tet-on啟動子和他莫昔芬誘導型啟動子。多種組成型、條件型和誘導型啟動子是本領域技術人員熟知的,并且本領域技術人員將能夠確定多種在實施本公開中有用的此類啟動子,其不限于這個方面。在不同實施方案中,本公開提供了具有用于驅動編碼融合蛋白(或其一個或多個單獨組分)的核酸序列的表達的適當啟動子的載體。

77、在蛋白質或核酸的上下文中,本文使用的術語“重組”是指在自然界中不存在但是人類工程化的產物的蛋白質或核酸。例如,在一些實施方案中,重組蛋白或核酸分子包含與任何天然存在的序列相比包含至少一個、至少兩個、至少三個、至少四個、至少五個、至少六個或至少七個突變的氨基酸或核苷酸序列。

78、如本文所用,術語“受試者”是指個體生物體,例如個體哺乳動物。在一些實施方案中,受試者是人。在一些實施方案中,受試者是非人哺乳動物。在一些實施方案中,受試者是非人靈長類動物。在一些實施方案中,受試者是嚙齒動物。在一些實施方案中,受試者是綿羊、山羊、牛、貓或狗。在一些實施方案中,受試者是脊椎動物、兩棲動物、爬行動物、魚、昆蟲、蠅或線蟲。在一些實施方案中,受試者是研究動物。在一些實施方案中,受試者是經基因工程的,例如經基因工程的非人受試者。受試者可以是性別不限的并且處于任何發(fā)展階段。

79、術語“靶位點”或“靶核酸”是指核酸分子內被融合蛋白(例如,本文提供的dcas9-脫氨酶融合蛋白)編輯的序列。靶位點進一步指與融合蛋白和grna的復合物結合的核酸分子內的序列。

80、術語“治療(treatment)”、“治療(treat)”和“治療(treating)”是指旨在逆轉、緩解、延遲疾病、病癥或病況或其一個或多個癥狀的發(fā)作或抑制其進展的臨床干預,如本文所述。如本文所用,術語“治療(treatment)”、“治療(treat)”和“治療(treating)”是指旨在逆轉、減輕、延遲疾病、病癥或病況或其一個或多個癥狀的發(fā)作或抑制其進展的臨床干預,如本文所述。在一些實施方案中,可以在一個或多個癥狀已經發(fā)展之后和/或在疾病已經被診斷之后施用治療。在其他實施方案中,可以在沒有癥狀的情況下施用治療,例如為了預防或延遲癥狀的發(fā)作或抑制疾病的發(fā)作或進展。例如,可以在癥狀發(fā)作之前(例如,鑒于癥狀歷史和/或鑒于遺傳或其他易感性因素)對易感個體施用治療。治療也可以在癥狀已經解決之后繼續(xù),例如,為預防或延遲其預防或復發(fā)。

81、如本文所用,術語“變體”是指具有偏離天然存在的特性的蛋白質,其保留至少一種功能,即結合、相互作用或酶促能力和/或其治療特性?!白凅w”與野生型蛋白具有至少約70%同一性、至少約80%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性、或至少約99.9%同一性。例如,cas9的變體可以包含與野生型cas9氨基酸序列相比具有一個或多個氨基酸殘基變化的cas9。作為另一個示例,脫氨酶的變體可以包含與野生型脫氨酶氨基酸序列相比具有一個或多個氨基酸殘基變化的脫氨酶,例如在脫氨酶的祖先序列重建之后。這些變化包括化學修飾,包括不同氨基酸殘基截短的置換、(例如標簽的)共價添加和任何其他突變。該術語還包括野生型蛋白的片段。

82、保留的特性的水平或程度相對于野生型蛋白可能降低,但通常在種類上相同或相似。通常,變體總體上非常相似,并且在許多區(qū)域中與本文所述蛋白質的氨基酸序列相同。本領域技術人員將認識到如何制造和使用變體,所述變體維持全部或至少一些功能能力或性質。

83、變體蛋白可以包含以下或者可替代地由以下組成:與例如野生型蛋白或本文提供的任何蛋白(例如cas9蛋白、融合蛋白和融合蛋白蛋白(fusion?protein?protein))的氨基酸序列至少80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。本公開中提供的另外的多肽由多核苷酸編碼,所述多核苷酸在嚴格雜交條件下(例如雜交以在約45攝氏度下在6x氯化鈉/檸檬酸鈉(ssc)中過濾結合的dna,隨后以0.2倍ssc,0.1%sds,在約50-65℃下洗滌一次或多次),在高度嚴格的條件下(例如雜交以在約45攝氏度下在6x氯化鈉/檸檬酸二鈉(ssc)中過濾結合的dna,然后在0.1x?ssc,0.2%sds,在約68攝氏度下洗滌一次或多次),或在本領域技術人員已知的其它嚴格雜交條件下(參見,例如,ausubel,f.m.等人,編輯,1989?current?protocol?in?molecular?biology,green?publishingassociates,inc.,和john?wiley?&?sons?inc.,new?york,pp.6.3.1-6.3.6和2.10.3)與編碼蛋白(諸如cas9蛋白)的核酸分子的互補物雜交。

84、通過具有與查詢氨基酸序列至少例如95%“同一性”的氨基酸序列的多肽,旨在主題多肽的氨基酸序列與查詢序列是相同的,除了主題多肽序列可以包括查詢氨基酸序列的每100個氨基酸多達五個氨基酸改變。換句話說,為了獲得具有與查詢氨基酸序列至少95%同一性的氨基酸序列的多肽,主題序列中多達5%的氨基酸殘基可以被插入、缺失或用另一氨基酸置換。參考序列的這些改變可以發(fā)生在參考氨基酸序列的氨基-或羧基-末端位置或那些末端位置之間的任何位置,單獨散布在參考序列中的殘基中或參考序列內的一個或多個連續(xù)基團中。

85、實際上,任何特定多肽是否與例如蛋白質(諸如cas9蛋白)的氨基酸序列為至少80%、85%、90%、95%、96%、97%、98%或99%同一性,可以使用已知的計算機程序常規(guī)地確定。

86、用于確定查詢序列(本公開的序列)和主題序列(也稱為全局序列比對)之間的最佳總體匹配的優(yōu)選方法,可以使用基于brutlag等人(comp.app.biosci.6:237-245(1990))的算法的fastdb計算機程序來確定。在序列比對中,查詢序列和主題序列是均是核苷酸序列或均是氨基酸序列。所述全局序列比對的結果表示為同一性百分比。在fastdb氨基酸比對中使用的優(yōu)選參數(shù)是:矩陣=pam?0(matrix=pam?0),k元組=2(k-tuple=2),錯配懲罰=l(mismatch?penalty=l),連接懲罰=20(joining?penalty=20),隨機化組長度=0(randomization?group?length=0),截止分數(shù)=l(cutoff?score=l),窗口大小=序列長度(window?size=sequence?length),空位懲罰=5(gap?penalty=5),空位大小懲罰=0.05(gapsize?penalty=0.05),窗口大小=500(window?size=500)或主題氨基酸序列的長度,以較短者為準。如果主題序列由于n或c端缺失而短于查詢序列,而不是由于內部缺失,則必須對結果進行手動校正。

87、這是因為當計算全局同一性百分比時fastdb程序不考慮主題序列的n和c端截短。對于相對于查詢序列在n端和c端截短的主題序列,通過計算作為主題序列的n端和c端的查詢序列的殘基(其與相應的主題殘基不匹配/比對)的數(shù)目作為查詢序列的總堿基的百分比來校正同一性百分比。殘基是否匹配/比對通過fastdb序列比對的結果確定。然后該百分比由百分比同一性減去,以得到最終的百分比同一性分數(shù),所述百分比同一性通過上述fastdb程序使用指定參數(shù)計算。該最終百分比同一性分數(shù)是用于本公開的目的。出于手動調整百分比同一性得分的目的,僅考慮與查詢序列不匹配/比對的主題序列的n和c端的殘基。也就是說,僅查詢主題序列的最遠n和c端殘基之外的殘基位置。

88、如本文所用,術語“野生型”是技術人員所理解的本領域術語,并且是指區(qū)別于突變體或變體形式的天然存在的生物體、菌株、基因或特征的典型形式。

89、本發(fā)明現(xiàn)在將通過示例并參考附圖進一步描述,附圖示出:

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1