Basic Usage

[1]:
import sglearn
[2]:
features = sglearn.featurize_guides(['GGGCGATAGCGTTGCAGTAGACGGTGGACC', 'ATGATCTGTGCCCGATTGATGACAGGGATG'])
features
[2]:
GC content A C T G AA AC AT AG CA ... P1G_+1G Tm DD guide Tm RD guide Tm RR guide Tm RD 1 to 10 Tm RD 11 to 20 PolyA PolyC PolyT PolyG
GGGCGATAGCGTTGCAGTAGACGGTGGACC 0.55 0.25 0.15 0.2 0.40 0.0 0.052632 0.052632 0.157895 0.052632 ... 0 52.916148 49.926983 0.2 17.560470 18.553565 1 1 2 2
ATGATCTGTGCCCGATTGATGACAGGGATG 0.50 0.20 0.25 0.3 0.25 0.0 0.052632 0.105263 0.000000 0.052632 ... 0 53.533232 52.397883 1.1 36.352952 10.397126 1 3 2 1

2 rows × 630 columns

[3]:
features.columns.values
[3]:
array(['GC content', 'A', 'C', 'T', 'G', 'AA', 'AC', 'AT', 'AG', 'CA',
       'CC', 'CT', 'CG', 'TA', 'TC', 'TT', 'TG', 'GA', 'GC', 'GT', 'GG',
       '-4A', '-4C', '-4T', '-4G', '-3A', '-3C', '-3T', '-3G', '-2A',
       '-2C', '-2T', '-2G', '-1A', '-1C', '-1T', '-1G', '1A', '1C', '1T',
       '1G', '2A', '2C', '2T', '2G', '3A', '3C', '3T', '3G', '4A', '4C',
       '4T', '4G', '5A', '5C', '5T', '5G', '6A', '6C', '6T', '6G', '7A',
       '7C', '7T', '7G', '8A', '8C', '8T', '8G', '9A', '9C', '9T', '9G',
       '10A', '10C', '10T', '10G', '11A', '11C', '11T', '11G', '12A',
       '12C', '12T', '12G', '13A', '13C', '13T', '13G', '14A', '14C',
       '14T', '14G', '15A', '15C', '15T', '15G', '16A', '16C', '16T',
       '16G', '17A', '17C', '17T', '17G', '18A', '18C', '18T', '18G',
       '19A', '19C', '19T', '19G', '20A', '20C', '20T', '20G', 'P1A',
       'P1C', 'P1T', 'P1G', 'P2A', 'P2C', 'P2T', 'P2G', 'P3A', 'P3C',
       'P3T', 'P3G', '+1A', '+1C', '+1T', '+1G', '+2A', '+2C', '+2T',
       '+2G', '+3A', '+3C', '+3T', '+3G', '-4AA', '-4AC', '-4AT', '-4AG',
       '-4CA', '-4CC', '-4CT', '-4CG', '-4TA', '-4TC', '-4TT', '-4TG',
       '-4GA', '-4GC', '-4GT', '-4GG', '-3AA', '-3AC', '-3AT', '-3AG',
       '-3CA', '-3CC', '-3CT', '-3CG', '-3TA', '-3TC', '-3TT', '-3TG',
       '-3GA', '-3GC', '-3GT', '-3GG', '-2AA', '-2AC', '-2AT', '-2AG',
       '-2CA', '-2CC', '-2CT', '-2CG', '-2TA', '-2TC', '-2TT', '-2TG',
       '-2GA', '-2GC', '-2GT', '-2GG', '-1AA', '-1AC', '-1AT', '-1AG',
       '-1CA', '-1CC', '-1CT', '-1CG', '-1TA', '-1TC', '-1TT', '-1TG',
       '-1GA', '-1GC', '-1GT', '-1GG', '1AA', '1AC', '1AT', '1AG', '1CA',
       '1CC', '1CT', '1CG', '1TA', '1TC', '1TT', '1TG', '1GA', '1GC',
       '1GT', '1GG', '2AA', '2AC', '2AT', '2AG', '2CA', '2CC', '2CT',
       '2CG', '2TA', '2TC', '2TT', '2TG', '2GA', '2GC', '2GT', '2GG',
       '3AA', '3AC', '3AT', '3AG', '3CA', '3CC', '3CT', '3CG', '3TA',
       '3TC', '3TT', '3TG', '3GA', '3GC', '3GT', '3GG', '4AA', '4AC',
       '4AT', '4AG', '4CA', '4CC', '4CT', '4CG', '4TA', '4TC', '4TT',
       '4TG', '4GA', '4GC', '4GT', '4GG', '5AA', '5AC', '5AT', '5AG',
       '5CA', '5CC', '5CT', '5CG', '5TA', '5TC', '5TT', '5TG', '5GA',
       '5GC', '5GT', '5GG', '6AA', '6AC', '6AT', '6AG', '6CA', '6CC',
       '6CT', '6CG', '6TA', '6TC', '6TT', '6TG', '6GA', '6GC', '6GT',
       '6GG', '7AA', '7AC', '7AT', '7AG', '7CA', '7CC', '7CT', '7CG',
       '7TA', '7TC', '7TT', '7TG', '7GA', '7GC', '7GT', '7GG', '8AA',
       '8AC', '8AT', '8AG', '8CA', '8CC', '8CT', '8CG', '8TA', '8TC',
       '8TT', '8TG', '8GA', '8GC', '8GT', '8GG', '9AA', '9AC', '9AT',
       '9AG', '9CA', '9CC', '9CT', '9CG', '9TA', '9TC', '9TT', '9TG',
       '9GA', '9GC', '9GT', '9GG', '10AA', '10AC', '10AT', '10AG', '10CA',
       '10CC', '10CT', '10CG', '10TA', '10TC', '10TT', '10TG', '10GA',
       '10GC', '10GT', '10GG', '11AA', '11AC', '11AT', '11AG', '11CA',
       '11CC', '11CT', '11CG', '11TA', '11TC', '11TT', '11TG', '11GA',
       '11GC', '11GT', '11GG', '12AA', '12AC', '12AT', '12AG', '12CA',
       '12CC', '12CT', '12CG', '12TA', '12TC', '12TT', '12TG', '12GA',
       '12GC', '12GT', '12GG', '13AA', '13AC', '13AT', '13AG', '13CA',
       '13CC', '13CT', '13CG', '13TA', '13TC', '13TT', '13TG', '13GA',
       '13GC', '13GT', '13GG', '14AA', '14AC', '14AT', '14AG', '14CA',
       '14CC', '14CT', '14CG', '14TA', '14TC', '14TT', '14TG', '14GA',
       '14GC', '14GT', '14GG', '15AA', '15AC', '15AT', '15AG', '15CA',
       '15CC', '15CT', '15CG', '15TA', '15TC', '15TT', '15TG', '15GA',
       '15GC', '15GT', '15GG', '16AA', '16AC', '16AT', '16AG', '16CA',
       '16CC', '16CT', '16CG', '16TA', '16TC', '16TT', '16TG', '16GA',
       '16GC', '16GT', '16GG', '17AA', '17AC', '17AT', '17AG', '17CA',
       '17CC', '17CT', '17CG', '17TA', '17TC', '17TT', '17TG', '17GA',
       '17GC', '17GT', '17GG', '18AA', '18AC', '18AT', '18AG', '18CA',
       '18CC', '18CT', '18CG', '18TA', '18TC', '18TT', '18TG', '18GA',
       '18GC', '18GT', '18GG', '19AA', '19AC', '19AT', '19AG', '19CA',
       '19CC', '19CT', '19CG', '19TA', '19TC', '19TT', '19TG', '19GA',
       '19GC', '19GT', '19GG', '20AA', '20AC', '20AT', '20AG', '20CA',
       '20CC', '20CT', '20CG', '20TA', '20TC', '20TT', '20TG', '20GA',
       '20GC', '20GT', '20GG', 'P1AA', 'P1AC', 'P1AT', 'P1AG', 'P1CA',
       'P1CC', 'P1CT', 'P1CG', 'P1TA', 'P1TC', 'P1TT', 'P1TG', 'P1GA',
       'P1GC', 'P1GT', 'P1GG', 'P2AA', 'P2AC', 'P2AT', 'P2AG', 'P2CA',
       'P2CC', 'P2CT', 'P2CG', 'P2TA', 'P2TC', 'P2TT', 'P2TG', 'P2GA',
       'P2GC', 'P2GT', 'P2GG', 'P3AA', 'P3AC', 'P3AT', 'P3AG', 'P3CA',
       'P3CC', 'P3CT', 'P3CG', 'P3TA', 'P3TC', 'P3TT', 'P3TG', 'P3GA',
       'P3GC', 'P3GT', 'P3GG', '+1AA', '+1AC', '+1AT', '+1AG', '+1CA',
       '+1CC', '+1CT', '+1CG', '+1TA', '+1TC', '+1TT', '+1TG', '+1GA',
       '+1GC', '+1GT', '+1GG', '+2AA', '+2AC', '+2AT', '+2AG', '+2CA',
       '+2CC', '+2CT', '+2CG', '+2TA', '+2TC', '+2TT', '+2TG', '+2GA',
       '+2GC', '+2GT', '+2GG', 'P1A_+1A', 'P1A_+1C', 'P1A_+1T', 'P1A_+1G',
       'P1C_+1A', 'P1C_+1C', 'P1C_+1T', 'P1C_+1G', 'P1T_+1A', 'P1T_+1C',
       'P1T_+1T', 'P1T_+1G', 'P1G_+1A', 'P1G_+1C', 'P1G_+1T', 'P1G_+1G',
       'Tm DD guide', 'Tm RD guide', 'Tm RR guide', 'Tm RD 1 to 10',
       'Tm RD 11 to 20', 'PolyA', 'PolyC', 'PolyT', 'PolyG'], dtype=object)
[3]: