{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | mol | \n", "CID | \n", "Class | \n", "Model | \n", "pIC50 | \n", "MW | \n", "AlogP | \n", "HBA | \n", "HBD | \n", "RB | \n", "... | \n", "PEOE6 (PEOE6) | \n", "PEOE7 (PEOE7) | \n", "PEOE8 (PEOE8) | \n", "PEOE9 (PEOE9) | \n", "PEOE10 (PEOE10) | \n", "PEOE11 (PEOE11) | \n", "PEOE12 (PEOE12) | \n", "PEOE13 (PEOE13) | \n", "PEOE14 (PEOE14) | \n", "canvasUID | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "O1CC[C@@H](NC(=O)[C@@H](Cc2cc3cc(ccc3nc2N)-c2c... | \n", "BACE_1 | \n", "1 | \n", "Train | \n", "9.154901 | \n", "431.56979 | \n", "4.4014 | \n", "3 | \n", "2 | \n", "5 | \n", "... | \n", "53.205711 | \n", "78.640335 | \n", "226.855410 | \n", "107.434910 | \n", "37.133846 | \n", "0.000000 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "1 | \n", "
1 | \n", "Fc1cc(cc(F)c1)C[C@H](NC(=O)[C@@H](N1CC[C@](NC(... | \n", "BACE_2 | \n", "1 | \n", "Train | \n", "8.853872 | \n", "657.81073 | \n", "2.6412 | \n", "5 | \n", "4 | \n", "16 | \n", "... | \n", "73.817162 | \n", "47.171600 | \n", "365.676940 | \n", "174.076750 | \n", "34.923889 | \n", "7.980170 | \n", "24.148668 | \n", "0.000000 | \n", "24.663788 | \n", "2 | \n", "
2 | \n", "S1(=O)(=O)N(c2cc(cc3c2n(cc3CC)CC1)C(=O)N[C@H](... | \n", "BACE_3 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "591.74091 | \n", "2.5499 | \n", "4 | \n", "3 | \n", "11 | \n", "... | \n", "70.365707 | \n", "47.941147 | \n", "192.406520 | \n", "255.752550 | \n", "23.654478 | \n", "0.230159 | \n", "15.879790 | \n", "0.000000 | \n", "24.663788 | \n", "3 | \n", "
3 | \n", "S1(=O)(=O)C[C@@H](Cc2cc(O[C@H](COCC)C(F)(F)F)c... | \n", "BACE_4 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "591.67828 | \n", "3.1680 | \n", "4 | \n", "3 | \n", "12 | \n", "... | \n", "56.657166 | \n", "37.954151 | \n", "194.353040 | \n", "202.763350 | \n", "36.498634 | \n", "0.980913 | \n", "8.188327 | \n", "0.000000 | \n", "26.385181 | \n", "4 | \n", "
4 | \n", "S1(=O)(=O)N(c2cc(cc3c2n(cc3CC)CC1)C(=O)N[C@H](... | \n", "BACE_5 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "629.71283 | \n", "3.5086 | \n", "3 | \n", "3 | \n", "11 | \n", "... | \n", "78.945702 | \n", "39.361153 | \n", "179.712880 | \n", "220.461300 | \n", "23.654478 | \n", "0.230159 | \n", "15.879790 | \n", "0.000000 | \n", "26.100143 | \n", "5 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
1508 | \n", "Clc1cc2nc(n(c2cc1)C(CC(=O)NCC1CCOCC1)CC)N | \n", "BACE_1543 | \n", "0 | \n", "Test | \n", "3.000000 | \n", "364.86969 | \n", "2.5942 | \n", "3 | \n", "2 | \n", "6 | \n", "... | \n", "37.212799 | \n", "37.681076 | \n", "180.226410 | \n", "95.670128 | \n", "30.107586 | \n", "9.368159 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "1543 | \n", "
1509 | \n", "Clc1cc2nc(n(c2cc1)C(CC(=O)NCc1ncccc1)CC)N | \n", "BACE_1544 | \n", "0 | \n", "Test | \n", "3.000000 | \n", "357.83731 | \n", "2.8229 | \n", "3 | \n", "2 | \n", "6 | \n", "... | \n", "45.792797 | \n", "47.349350 | \n", "122.401500 | \n", "99.877144 | \n", "30.107586 | \n", "9.368159 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "1544 | \n", "
1510 | \n", "Brc1cc(ccc1)C1CC1C=1N=C(N)N(C)C(=O)C=1 | \n", "BACE_1545 | \n", "0 | \n", "Test | \n", "2.953115 | \n", "320.18451 | \n", "3.0895 | \n", "2 | \n", "1 | \n", "2 | \n", "... | \n", "47.790600 | \n", "22.563574 | \n", "96.290794 | \n", "58.798935 | \n", "20.071724 | \n", "9.368159 | \n", "0.000000 | \n", "6.904104 | \n", "0.000000 | \n", "1545 | \n", "
1511 | \n", "O=C1N(C)C(=NC(=C1)C1CC1c1cc(ccc1)-c1ccccc1)N | \n", "BACE_1546 | \n", "0 | \n", "Test | \n", "2.733298 | \n", "317.38440 | \n", "3.8595 | \n", "2 | \n", "1 | \n", "3 | \n", "... | \n", "77.219978 | \n", "9.316234 | \n", "95.907784 | \n", "112.609720 | \n", "20.071724 | \n", "9.368159 | \n", "0.000000 | \n", "6.904104 | \n", "0.000000 | \n", "1546 | \n", "
1512 | \n", "Clc1cc2nc(n(c2cc1)CCCC(=O)NCC1CC1)N | \n", "BACE_1547 | \n", "0 | \n", "Test | \n", "2.544546 | \n", "306.79059 | \n", "3.4271 | \n", "2 | \n", "2 | \n", "6 | \n", "... | \n", "26.907076 | \n", "37.681076 | \n", "161.450780 | \n", "40.882919 | \n", "30.107586 | \n", "9.368159 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "1547 | \n", "
1513 rows × 595 columns
\n", "\n", " | mol | \n", "CID | \n", "Class | \n", "Model | \n", "pIC50 | \n", "MW | \n", "AlogP | \n", "HBA | \n", "HBD | \n", "RB | \n", "... | \n", "PEOE6 (PEOE6) | \n", "PEOE7 (PEOE7) | \n", "PEOE8 (PEOE8) | \n", "PEOE9 (PEOE9) | \n", "PEOE10 (PEOE10) | \n", "PEOE11 (PEOE11) | \n", "PEOE12 (PEOE12) | \n", "PEOE13 (PEOE13) | \n", "PEOE14 (PEOE14) | \n", "canvasUID | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "O1CC[C@@H](NC(=O)[C@@H](Cc2cc3cc(ccc3nc2N)-c2c... | \n", "BACE_1 | \n", "1 | \n", "Train | \n", "9.154901 | \n", "431.56979 | \n", "4.4014 | \n", "3 | \n", "2 | \n", "5 | \n", "... | \n", "53.205711 | \n", "78.640335 | \n", "226.855410 | \n", "107.43491 | \n", "37.133846 | \n", "0.000000 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "1 | \n", "
1 | \n", "Fc1cc(cc(F)c1)C[C@H](NC(=O)[C@@H](N1CC[C@](NC(... | \n", "BACE_2 | \n", "1 | \n", "Train | \n", "8.853872 | \n", "657.81073 | \n", "2.6412 | \n", "5 | \n", "4 | \n", "16 | \n", "... | \n", "73.817162 | \n", "47.171600 | \n", "365.676940 | \n", "174.07675 | \n", "34.923889 | \n", "7.980170 | \n", "24.148668 | \n", "0.000000 | \n", "24.663788 | \n", "2 | \n", "
2 | \n", "S1(=O)(=O)N(c2cc(cc3c2n(cc3CC)CC1)C(=O)N[C@H](... | \n", "BACE_3 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "591.74091 | \n", "2.5499 | \n", "4 | \n", "3 | \n", "11 | \n", "... | \n", "70.365707 | \n", "47.941147 | \n", "192.406520 | \n", "255.75255 | \n", "23.654478 | \n", "0.230159 | \n", "15.879790 | \n", "0.000000 | \n", "24.663788 | \n", "3 | \n", "
3 | \n", "S1(=O)(=O)C[C@@H](Cc2cc(O[C@H](COCC)C(F)(F)F)c... | \n", "BACE_4 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "591.67828 | \n", "3.1680 | \n", "4 | \n", "3 | \n", "12 | \n", "... | \n", "56.657166 | \n", "37.954151 | \n", "194.353040 | \n", "202.76335 | \n", "36.498634 | \n", "0.980913 | \n", "8.188327 | \n", "0.000000 | \n", "26.385181 | \n", "4 | \n", "
4 | \n", "S1(=O)(=O)N(c2cc(cc3c2n(cc3CC)CC1)C(=O)N[C@H](... | \n", "BACE_5 | \n", "1 | \n", "Train | \n", "8.698970 | \n", "629.71283 | \n", "3.5086 | \n", "3 | \n", "3 | \n", "11 | \n", "... | \n", "78.945702 | \n", "39.361153 | \n", "179.712880 | \n", "220.46130 | \n", "23.654478 | \n", "0.230159 | \n", "15.879790 | \n", "0.000000 | \n", "26.100143 | \n", "5 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
789 | \n", "Fc1cc(cc(F)c1)CC(NC(=O)C)C(O)C[NH2+]C1(CCCCC1)... | \n", "BACE_821 | \n", "1 | \n", "Test | \n", "7.000000 | \n", "457.57581 | \n", "3.8757 | \n", "2 | \n", "3 | \n", "9 | \n", "... | \n", "32.844196 | \n", "68.638565 | \n", "260.466370 | \n", "108.20742 | \n", "23.302103 | \n", "7.980170 | \n", "8.188327 | \n", "0.000000 | \n", "24.663788 | \n", "821 | \n", "
790 | \n", "Fc1ccc(cc1OCCCCF)[C@]1(N=C(N)N(C)C1=O)c1ccc(OC... | \n", "BACE_822 | \n", "1 | \n", "Test | \n", "7.000000 | \n", "439.40341 | \n", "4.4032 | \n", "4 | \n", "0 | \n", "9 | \n", "... | \n", "25.739992 | \n", "48.511223 | \n", "89.019829 | \n", "138.51161 | \n", "36.094353 | \n", "8.951914 | \n", "7.980170 | \n", "0.000000 | \n", "6.970751 | \n", "822 | \n", "
791 | \n", "O=C1N(C)C(=NC1(c1cc(ccc1)-c1cncnc1)c1cn(nc1)C)N | \n", "BACE_823 | \n", "1 | \n", "Test | \n", "7.000000 | \n", "347.37390 | \n", "0.2846 | \n", "5 | \n", "0 | \n", "3 | \n", "... | \n", "25.739992 | \n", "13.182580 | \n", "127.748380 | \n", "97.01915 | \n", "44.097675 | \n", "3.271739 | \n", "7.980170 | \n", "0.000000 | \n", "0.000000 | \n", "823 | \n", "
792 | \n", "FC1(F)CN2C(=NC1)C(N=C2N)(c1cc(ccc1)-c1cncnc1)c... | \n", "BACE_824 | \n", "1 | \n", "Test | \n", "7.000000 | \n", "434.44131 | \n", "2.6596 | \n", "5 | \n", "0 | \n", "4 | \n", "... | \n", "42.899986 | \n", "32.988831 | \n", "58.408638 | \n", "173.93533 | \n", "57.899143 | \n", "3.271739 | \n", "0.000000 | \n", "-1.273524 | \n", "0.000000 | \n", "824 | \n", "
793 | \n", "S1(=O)(=O)CC(Cc2cc(OCCOC)c(N)c(F)c2)C(O)C([NH2... | \n", "BACE_825 | \n", "1 | \n", "Test | \n", "7.000000 | \n", "509.65369 | \n", "1.7831 | \n", "4 | \n", "3 | \n", "10 | \n", "... | \n", "56.657166 | \n", "27.648426 | \n", "167.337080 | \n", "231.51552 | \n", "36.498634 | \n", "0.000000 | \n", "8.188327 | \n", "0.000000 | \n", "24.663788 | \n", "825 | \n", "
691 rows × 595 columns
\n", "