Firma Codagene jest właścicielem marki genomic.me. Wprowadzamy właśnie zaawansowane testy genetyczne na rynek. Pracujemy również wykonując usługi z dziedziny bioinformatyki i data science koncentrując sie na zdrowiu i medycynie spersonalizowanej. Szukamy ludzi z dobrymi podstawami z matematyki, statystyki, modelowania matematycznego, programowania, data science, przetwarzania obrazów. Znajmość bionformatyki czy biologii jest plusem, ale nie jest konieczna.
------------------------------------
Interesuje Cię praca, w której mógłbyś realizować ambitne projekty naukowe przy okazji rozwiązując realne problemy firmy? Interesuje Cię wykorzystanie metod sztucznej inteligencji i maszynowego uczenia w praktyce? Obecnie poszukujemy dwóch osób do realizacji dwóch projektów, których opis znajduje się poniżej.
Projekt 1 - Metody i narzędzia eksploracji danych dla analizy populacyjnej danych NGS (WGS i WES) dla zastosowań profilaktyki spersonalizowanej.
Jednym z zadań kandydata będzie rozwój narzędzi do analiz genomicznych pochodzących z sekwencjonowania nowej generacji, którego przetwarzaniem zajmuje się firma Codagene. Kandydat zajmie się integracją i eksploracją danych NGS i klinicznych stosując techniki biologii systemów, uczenia maszynowego oraz sztucznej
inteligencji. Kolejnym zadaniem będzie aktywny udział w tworzeniu metod oraz narzędzi analitycznych dla analiz wysokoprzepustowych sekwencjonowania nowej generacji dla danych gromadzonych w genomicznej bazie danych. Budowę kompleksowych narzędzi analitycznych firma Codagene wykonuje dla podmiotów zewnętrznych, m.in. dla duńskiego ministerstwa zdrowia. Kandydat będzie brał udział w tych pracach, rozwijał je dalej, tak aby firma była w posiadaniu najlepszych rozwiązań w tym zakresie. Rozwiązania bazujące na rozproszeniu obliczeń oraz na mocy obliczeniowej kart graficznych (GPU) będą przedmiotem pracy kandydata. Kandydat będzie brał również udział w tworzeniu metod optymalizacji użycia danych wielkoskalowych (Big Data), a szczególnie w opracowaniu nowych i efektywnych metod kompresji danych. Jest to ważne zadanie w dobie gigantycznego przyrostu danych. Kandydat stanie się również biegły w używaniu chmur obliczeniowych jak i technik konteneryzacji programów, z których firma korzysta.
Projekt 2 - Rozwój i optymalizacja narzędzi opartych o sztuczną inteligencję i uczenie maszynowe w celu wspomagania analizy oraz integracji danych klinicznych i obrazowania pacjentów onkologicznych
Kandydat będzie zajmował się m.in. rozwijaniem metod do oceny genomu pacjenta onkologicznego. System ten zintegruje wybrane bazy danych, takie jak np. ClinVar, czy
dbSNP, jak również bazy danych zawierające informacje strice o nowotworach czyli np. mutacjach i o powiązanych z nimi terapiach celowanych. Wszystko po to aby stworzyć
wygodne narzędzie do analizy danych NGS, które często nie są przez lekarza dostatecznie zrozumiałe, które posłuży do lepszego personalizowania terapii onkologicznej. Istnieje szereg narzędzi które mogą być wykorzystane w onkologii, zarówno na poziomie genomu np. SNVmix, BeakDancer, transktyptomu np. Kallisto, HTseq oraz proteomu, jak np. Trans-Proteomic Pipeline. Niektóre z wymienionych programów mogą być wykorzystane w projekcie jak również, przy wsparciu zespołu Codagene, kandydat będzie rozwijał nowe metody/narzędzia. Oprócz danych multi-omicznych dla każdego pacjenta generowane są wyniki badań krwi z konwencjonalnymi markerami tkanek jak np. immunohistochemiczne barwienie wybranych markerów w guzie pacjenta lub np. dane z obrazowania. W zakresie analizy obrazowania istnieje potrzeba i prowadzone są wysiłki na rzecz odciążenia radiologa przy zastosowaniu metod maszynowego uczenia oraz sztucznej inteligencji. Zautomatyzowane narzędzie implementujące nowe metody przetwarzania obrazów MRI/CT posłuży jako dodatkowy głos doradczy równocześnie minimalizując ryzyko błędnej diagnozy.
Niezbędne umiejętności:
- Znajomość min. 2 języków programowania R, Python, Matlab, Java, Perl, C++, inne? - zaskocz nas :)
- Znajomość języka angielskiego w stopniu komunikatywnym w piśmie i w mowie.
- Znajomość zagadnień z bioinformatyki, statystyki lub uczenia maszynowego.
- Stopień magistra - najlepiej kończone studia na kierunku bioinformatyka, data science, informatyka, fizyka, matematyka lub pokrewne.
Mile widziane:
- Publikacje naukowe
- Znajomość bibliotek do uczenia maszynowego, sztucznych sieci neuronowych (np. Keras, mlr etc.)
- Udokumentowana znajomość bioinformatyki, biostatystyki, uczenia maszynowego, np. projekty, publikacje.
- Znajomość genetyki populacyjnej.
- Znajomość zagadnień z genomiki/transkyptomiki raka.
- Singularity, Docker, …
Czas i miejsce pracy:
Codagene Sp. z o.o
Częstochowa, Jasnogórska 26
Okres próbny 6 miesiące, potem stałe zatrudnienie.
Możliwa praca zdalna w początkowym okresie (np. 50/50).
Kontakt: dr inż. Marcin Krzystanek