Одна из особенностей развития эпителиальных клеток - их возможность в определенный момент менять свой фенотип и превращаться в мезенхимальные клетки посредствам эпителиально-мезенхимального перехода (ЭМП). Этот процесс запускается в эмбриогенезе, активируется при заживлении ран и регенерации тканей, а также, как считается, является ключевым в приобретении опухолью способности к метастазированию. Интересно, что процесс является обратимым (мезенхимально-эпителиальный переход (МЭП)) и, по-видимому, МЭП ответственен за возможность формирования вторичных опухолей.
Оба перехода регулируются активацией и супрессией огромного числа генов, некодирующими РНК, хроматиновыми перестройками и эпигенетическими модификациями, что делает их описание довольно трудоёмкой задачей. К настоящему моменту существуют базы данных, в которых перечислены гены, вовлеченные в ЭМП (например, dbEMP), однако данные накапливаются с ужасающей быстротой (так, dbEMP содержит информацию собранную из 2300 статей, в то время как на настоящий момент на запрос epithelial-mesenchymal transition сервис NCBI pubmed находит в 10 раз больше статей). Участникам проекта будет предложено на основе NCBI pubmed создать свою актуальную базу данных по генам, участвующим в процессах и, если позволит время, проанализировать данные.
Задачи проекта
1) Используя сервис NCBI pubmed, собрать коллекцию аннотаций (abstract) к статьям по запросу "epithelial-mesenchymal transition".
2) На основе text-mining'а по ключевым словам (gene, act suppress, activate, etc) создать модель для поиска интересующих генов и их роли в эпителиально-мезенхимальном переходе.
3) Полученные в результате применения модели к коллекции аннотаций данные объединить в базу данных.
Требования к участникам
Приоритетными навыками участников являются: умение программировать (в том числе навыки использования REST API, базовые навыки обращения с базами данных), навыки в области NLP (natural-language processing), базовые знания в биологии.