Технології секвенування короткого зчитування дають дуже велику кількість зчитувань, які наразі сприяють використанню графіків де Брейна. Графи де Брейна також добре підходять для що представляють геноми з повторами, тоді як методи перекриття повинні маскувати повтори, які довші за довжину зчитування.8 листопада 2011
Деякі з найбільш значних досягнень у тому, як дані послідовності короткого зчитування обробляється завдяки застосуванню графів де Брейна (DBG), які є мережами, що представляють зв’язки, що перекриваються між фрагментами послідовності, званими k-мерами, отриманими з набору вхідних послідовностей [2].
Графік де Брейна. Кожна чотиризначна послідовність зустрічається рівно один раз, якщо кожне ребро проходить рівно один раз і повертається до вихідної точки (Ейлерів цикл). Кожна тризначна послідовність зустрічається рівно один раз, якщо відвідувати кожну вершину рівно один раз (гамільтонів шлях).
Секвенування de novo генерує початкову геномну послідовність певного організму без еталонного геному. Послуги можуть бути застосовані для дослідження тварин, рослин і мікроорганізмів, включаючи філогенетичні дослідження, аналіз видового різноманіття, генетичних маркерів та інші геномні дослідження.
Очевидно, графіки перекриття є більш інформативними (стосовно вхідних даних), ніж графіки де Брейна, але вони зазвичай вимагають більше обчислювальних ресурсів для створення та зберігання. З іншого боку, простіша структура графіків де Брейна може дозволити застосувати деякі більш складні аргументи.
Послідовність порядку де Брейна — це циклічна послідовність довжини, де кожен підрядок довжини є унікальним двійковим рядком. Як приклад, циклічна послідовність 0000100110101111 довжиною 16 є послідовністю де Брейна для .