Basic Usage¶
[1]:
import sglearn
[2]:
features = sglearn.featurize_guides(['GGGCGATAGCGTTGCAGTAGACGGTGGACC', 'ATGATCTGTGCCCGATTGATGACAGGGATG'])
features
[2]:
| GC content | A | C | T | G | AA | AC | AT | AG | CA | ... | P1G_+1G | Tm DD guide | Tm RD guide | Tm RR guide | Tm RD 1 to 10 | Tm RD 11 to 20 | PolyA | PolyC | PolyT | PolyG | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| GGGCGATAGCGTTGCAGTAGACGGTGGACC | 0.55 | 0.25 | 0.15 | 0.2 | 0.40 | 0.0 | 0.052632 | 0.052632 | 0.157895 | 0.052632 | ... | 0 | 52.916148 | 49.926983 | 0.2 | 17.560470 | 18.553565 | 1 | 1 | 2 | 2 |
| ATGATCTGTGCCCGATTGATGACAGGGATG | 0.50 | 0.20 | 0.25 | 0.3 | 0.25 | 0.0 | 0.052632 | 0.105263 | 0.000000 | 0.052632 | ... | 0 | 53.533232 | 52.397883 | 1.1 | 36.352952 | 10.397126 | 1 | 3 | 2 | 1 |
2 rows × 630 columns
[3]:
features.columns.values
[3]:
array(['GC content', 'A', 'C', 'T', 'G', 'AA', 'AC', 'AT', 'AG', 'CA',
'CC', 'CT', 'CG', 'TA', 'TC', 'TT', 'TG', 'GA', 'GC', 'GT', 'GG',
'-4A', '-4C', '-4T', '-4G', '-3A', '-3C', '-3T', '-3G', '-2A',
'-2C', '-2T', '-2G', '-1A', '-1C', '-1T', '-1G', '1A', '1C', '1T',
'1G', '2A', '2C', '2T', '2G', '3A', '3C', '3T', '3G', '4A', '4C',
'4T', '4G', '5A', '5C', '5T', '5G', '6A', '6C', '6T', '6G', '7A',
'7C', '7T', '7G', '8A', '8C', '8T', '8G', '9A', '9C', '9T', '9G',
'10A', '10C', '10T', '10G', '11A', '11C', '11T', '11G', '12A',
'12C', '12T', '12G', '13A', '13C', '13T', '13G', '14A', '14C',
'14T', '14G', '15A', '15C', '15T', '15G', '16A', '16C', '16T',
'16G', '17A', '17C', '17T', '17G', '18A', '18C', '18T', '18G',
'19A', '19C', '19T', '19G', '20A', '20C', '20T', '20G', 'P1A',
'P1C', 'P1T', 'P1G', 'P2A', 'P2C', 'P2T', 'P2G', 'P3A', 'P3C',
'P3T', 'P3G', '+1A', '+1C', '+1T', '+1G', '+2A', '+2C', '+2T',
'+2G', '+3A', '+3C', '+3T', '+3G', '-4AA', '-4AC', '-4AT', '-4AG',
'-4CA', '-4CC', '-4CT', '-4CG', '-4TA', '-4TC', '-4TT', '-4TG',
'-4GA', '-4GC', '-4GT', '-4GG', '-3AA', '-3AC', '-3AT', '-3AG',
'-3CA', '-3CC', '-3CT', '-3CG', '-3TA', '-3TC', '-3TT', '-3TG',
'-3GA', '-3GC', '-3GT', '-3GG', '-2AA', '-2AC', '-2AT', '-2AG',
'-2CA', '-2CC', '-2CT', '-2CG', '-2TA', '-2TC', '-2TT', '-2TG',
'-2GA', '-2GC', '-2GT', '-2GG', '-1AA', '-1AC', '-1AT', '-1AG',
'-1CA', '-1CC', '-1CT', '-1CG', '-1TA', '-1TC', '-1TT', '-1TG',
'-1GA', '-1GC', '-1GT', '-1GG', '1AA', '1AC', '1AT', '1AG', '1CA',
'1CC', '1CT', '1CG', '1TA', '1TC', '1TT', '1TG', '1GA', '1GC',
'1GT', '1GG', '2AA', '2AC', '2AT', '2AG', '2CA', '2CC', '2CT',
'2CG', '2TA', '2TC', '2TT', '2TG', '2GA', '2GC', '2GT', '2GG',
'3AA', '3AC', '3AT', '3AG', '3CA', '3CC', '3CT', '3CG', '3TA',
'3TC', '3TT', '3TG', '3GA', '3GC', '3GT', '3GG', '4AA', '4AC',
'4AT', '4AG', '4CA', '4CC', '4CT', '4CG', '4TA', '4TC', '4TT',
'4TG', '4GA', '4GC', '4GT', '4GG', '5AA', '5AC', '5AT', '5AG',
'5CA', '5CC', '5CT', '5CG', '5TA', '5TC', '5TT', '5TG', '5GA',
'5GC', '5GT', '5GG', '6AA', '6AC', '6AT', '6AG', '6CA', '6CC',
'6CT', '6CG', '6TA', '6TC', '6TT', '6TG', '6GA', '6GC', '6GT',
'6GG', '7AA', '7AC', '7AT', '7AG', '7CA', '7CC', '7CT', '7CG',
'7TA', '7TC', '7TT', '7TG', '7GA', '7GC', '7GT', '7GG', '8AA',
'8AC', '8AT', '8AG', '8CA', '8CC', '8CT', '8CG', '8TA', '8TC',
'8TT', '8TG', '8GA', '8GC', '8GT', '8GG', '9AA', '9AC', '9AT',
'9AG', '9CA', '9CC', '9CT', '9CG', '9TA', '9TC', '9TT', '9TG',
'9GA', '9GC', '9GT', '9GG', '10AA', '10AC', '10AT', '10AG', '10CA',
'10CC', '10CT', '10CG', '10TA', '10TC', '10TT', '10TG', '10GA',
'10GC', '10GT', '10GG', '11AA', '11AC', '11AT', '11AG', '11CA',
'11CC', '11CT', '11CG', '11TA', '11TC', '11TT', '11TG', '11GA',
'11GC', '11GT', '11GG', '12AA', '12AC', '12AT', '12AG', '12CA',
'12CC', '12CT', '12CG', '12TA', '12TC', '12TT', '12TG', '12GA',
'12GC', '12GT', '12GG', '13AA', '13AC', '13AT', '13AG', '13CA',
'13CC', '13CT', '13CG', '13TA', '13TC', '13TT', '13TG', '13GA',
'13GC', '13GT', '13GG', '14AA', '14AC', '14AT', '14AG', '14CA',
'14CC', '14CT', '14CG', '14TA', '14TC', '14TT', '14TG', '14GA',
'14GC', '14GT', '14GG', '15AA', '15AC', '15AT', '15AG', '15CA',
'15CC', '15CT', '15CG', '15TA', '15TC', '15TT', '15TG', '15GA',
'15GC', '15GT', '15GG', '16AA', '16AC', '16AT', '16AG', '16CA',
'16CC', '16CT', '16CG', '16TA', '16TC', '16TT', '16TG', '16GA',
'16GC', '16GT', '16GG', '17AA', '17AC', '17AT', '17AG', '17CA',
'17CC', '17CT', '17CG', '17TA', '17TC', '17TT', '17TG', '17GA',
'17GC', '17GT', '17GG', '18AA', '18AC', '18AT', '18AG', '18CA',
'18CC', '18CT', '18CG', '18TA', '18TC', '18TT', '18TG', '18GA',
'18GC', '18GT', '18GG', '19AA', '19AC', '19AT', '19AG', '19CA',
'19CC', '19CT', '19CG', '19TA', '19TC', '19TT', '19TG', '19GA',
'19GC', '19GT', '19GG', '20AA', '20AC', '20AT', '20AG', '20CA',
'20CC', '20CT', '20CG', '20TA', '20TC', '20TT', '20TG', '20GA',
'20GC', '20GT', '20GG', 'P1AA', 'P1AC', 'P1AT', 'P1AG', 'P1CA',
'P1CC', 'P1CT', 'P1CG', 'P1TA', 'P1TC', 'P1TT', 'P1TG', 'P1GA',
'P1GC', 'P1GT', 'P1GG', 'P2AA', 'P2AC', 'P2AT', 'P2AG', 'P2CA',
'P2CC', 'P2CT', 'P2CG', 'P2TA', 'P2TC', 'P2TT', 'P2TG', 'P2GA',
'P2GC', 'P2GT', 'P2GG', 'P3AA', 'P3AC', 'P3AT', 'P3AG', 'P3CA',
'P3CC', 'P3CT', 'P3CG', 'P3TA', 'P3TC', 'P3TT', 'P3TG', 'P3GA',
'P3GC', 'P3GT', 'P3GG', '+1AA', '+1AC', '+1AT', '+1AG', '+1CA',
'+1CC', '+1CT', '+1CG', '+1TA', '+1TC', '+1TT', '+1TG', '+1GA',
'+1GC', '+1GT', '+1GG', '+2AA', '+2AC', '+2AT', '+2AG', '+2CA',
'+2CC', '+2CT', '+2CG', '+2TA', '+2TC', '+2TT', '+2TG', '+2GA',
'+2GC', '+2GT', '+2GG', 'P1A_+1A', 'P1A_+1C', 'P1A_+1T', 'P1A_+1G',
'P1C_+1A', 'P1C_+1C', 'P1C_+1T', 'P1C_+1G', 'P1T_+1A', 'P1T_+1C',
'P1T_+1T', 'P1T_+1G', 'P1G_+1A', 'P1G_+1C', 'P1G_+1T', 'P1G_+1G',
'Tm DD guide', 'Tm RD guide', 'Tm RR guide', 'Tm RD 1 to 10',
'Tm RD 11 to 20', 'PolyA', 'PolyC', 'PolyT', 'PolyG'], dtype=object)
[3]: