bioinformatics — все вопросы

2ответа
4 голоса
Улучшение использования clojure lazy-seq для итеративного анализа текста
Я пишу реализацию Clojure для это проблема кодирования , пытающаяся найти среднюю длину записей последовательности в формате Fasta: >1 GATCGA GTC >2 GCA >3 AAAAA Дополнительную информ
2ответа
4 голоса
R: ape /phylobase: невозможно преобразовать ультраметрическое двоичное дерево в объект hclust (предупреждающее сообщение)
Я импортировал дерево ClustalW2 в R, используя функцию ape и функцию read.tree пакета ape. Я оцениваю молекулярные возрасты, используя функцию хронопл, что приводит к ультраметрическому бинарному де
2ответа
4 голоса
Автоматическая загрузка нескольких файлов в R-Shiny
Я пытаюсь выяснить, как получить data.frame для подмножества, а затем написать файл .csv для каждого подмножества. Я пишу приложение shiny, которое будет генерировать файлы шаблонов для различных ин
2ответа
4 голоса
Объединить столбцы с несколькими значениями
У меня есть фрейм данных, cluster и один из столбцов, cluster$Genes, выглядит так: ENSG00000134684 ENSG00000188846, ENSG00000181163, ENSG00000114391 ENSG00000134684, ENSG00000175390 ENSG0000013468
2ответа
4 голоса
Цикл Bash-скрипта работает только один раз
Я пытаюсь проанализировать входной файл (мой тестовый файл состоит из 4 строк) и затем выполнить запрос к онлайновой биологической базе данных Однако мой цикл, кажется, останавливается после возврат
3ответа
4 голоса
Perl Script для поиска мотива в мультифаст-файле и печати всей последовательности вместе со строкой заголовка
Я могу найти мотив в файле мульти-фаста и напечатать строку, содержащую этот мотив .... но мне нужно распечатать все последовательности вместе со строкой заголовка мотива, содержащего последовательн
3ответа
4 голоса
Perl Script для поиска мотива в мультифаст-файле и печати всей последовательности вместе со строкой заголовка
Я могу найти мотив в файле мульти-фаста и напечатать строку, содержащую этот мотив .... но мне нужно распечатать все последовательности вместе со строкой заголовка мотива, содержащего последовательн
2ответа
4 голоса
Python - кластеризация с помощью K-средних. Некоторые столбцы с нулевой дисперсией
У меня есть набор данных, состоящий из ~ 200 99x20 массивов частот, каждый столбец суммируется в единицу. Я построил их с использованием тепловых карт, таких как . Каждый массив довольно разреженный
3ответа
4 голоса
Построение филогенетического дерева
У меня есть список списков, подобных этому matches = [[['rootrank', 'Root'], ['domain', 'Bacteria'], ['phylum', 'Firmicutes'], ['class', 'Clostridia'], ['order', 'Clostridiales'], ['family', 'Lach
1ответ
4 голоса
Лучший способ получить список SNP по идентификатору гена?
У меня есть длинная база данных генов и различных форм идентификаторов для них (например, OMIM, Ensembl, Genatlas).Я хочу получить список всех SNP, которые связаны с каждым геном.(Это обратная сторона
1ответ
4 голоса
Сгенерировать все возможные комбинации из 2 символов из потенциальной строки из 8 символов?
У меня есть для создания всех возможных комбинаций кортежа кортежей---- +: = 1 =: + ---- и ---- +: = 2 =: + ---- .Требованиянет повторовоснования могут быть одинаковыми, но позиции должны быть разными
3ответа
4 голоса
Как извлечь начальный и конечный кодоны из последовательностей ДНК в Perl?
У меня есть код ниже, который пытается определить положение начального и конечного кодонов данных последовательностей ДНК.Мы определяем стартовый кодон как последовательность ATG и конечный кодон как
3ответа
4 голоса
построить последовательность ДНК на основе вариации и ссылки человека
Проект «1000 геномов» предоставляет нам информацию о «вариации» последовательности ДНК тысяч людей относительно последовательности эталонной ДНК человека.Вариант хранится в файле VCFформат.По сути, дл
2ответа
4 голоса
как конвертировать формат PHYLIP в FASTA
Я только начинаю работать с Perl, и у меня есть вопрос.У меня есть файл PHYLIP, и мне нужно конвертировать его в FASTA.Я начинаю писать сценарий.Во-первых, я удалил пробелы в строках, теперь мне нужно
1ответ
4 голоса
BioPython: как преобразовать алфавит аминокислот в
При обсуждении того, как импортировать данные последовательности с помощью Bio.SeqIO.parse (), поваренная книга BioPython утверждает, что:Существует необязательный аргумент алфавит для указания алфави
2ответа
4 голоса
Использование псевдоцвета на графике рассеяния ggplot2 для указания плотности
Кто-нибудь знает, как создать график, похожий на тот, что на скриншоте?Я пытался получить аналогичный эффект, регулируя альфа, но это делает выбросы почти невидимыми.Я знаю этот тип графиков только из
3ответа
4 голоса
Генерация всех комбинаций нуклеотидных k-мер между диапазоном (i, j)
Мне нужно сформировать список всех возможных нуклеотидных комбинаций длиной от 5 до 15.Ожидаемые результаты:Я пытался:Но это не работает, если ---- +: = 3 =: + ---- .Заранее спасибо!
3ответа
4 голоса
Частые слова в Python
Как я могу написать код, чтобы найти наиболее частые 2-мер "GATCCAGATCCCCATAC".Я написал этот код, но, похоже, я ошибаюсь, пожалуйста, помогите исправить меня.Этот код печатает наиболее частый k-мер в
3ответа
4 голоса
Составьте список в Python из текстового файла FASTA
I have text file like this small example: >ENST00000491024.1|ENSG00000187583.6|OTTHUMG00000040756.4|OTTHUMT00000097942.2|PLEKHN1-003|PLEKHN1|176 SLESSPDAPDHTSETSHSPLYADPYTPPATSHRRVTDVRGLEEFLSA
4ответа
4 голоса
Python, разделить строку на несколько подстрок
У меня есть строка РНК, то есть:Я хотел бы сгенерировать все подстроки следующим образом:Я написал код, который решает первую подзадачу:Я пытался изменить начальную позицию, т. Е .:Но это дает мне нев
1 2 3

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132