R объединить кадры данных, разрешить неточное сопоставление идентификаторов (например, с дополнительными символами 1234 соответствует ab1234)

Я пытаюсь иметь дело с очень грязными данными.Мне нужно объединить два больших фрейма данных, которые содержат разные типы данных по идентификатору образца.Проблема в том, что идентификаторы образцов одной таблицы имеют множество разных форматов, но большинство из них содержат необходимую строку идентификатора для сопоставления где-то в своем идентификаторе, например образец «1234» в одной таблице имеет идентификатор «ProjectB (1234)» в другой..Я привел минимально воспроизводимый пример.использование слияния становится частью пути:но результат, который понравится, в основном:Мне просто интересно, есть ли способ включить grep в этот или другой метод R-tastic?заранее спасибо
7 голосов | спросил bioinformagician 16 Jpm1000000pmThu, 16 Jan 2014 18:59:35 +040014 2014, 18:59:35

0 ответов


Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132