Лаборатория компьютерной филологии Башкирского государственного университета разместила в интернете корпус поэтических текстов на башкирском языке. Работы по созданию корпуса были осуществлены при поддержке Центра лингвистических исследований мировой поэзии Института языкознания РАН. Он охватывает башкирскую поэзию XX–XXI века. Самое старое размещенное в корпусе стихотворение написано Мажитом Гафури в 1902 году.
Башкирский поэтический корпус содержит более 1,8 миллионов словоупотреблений, что составляет около 450 тысяч стихотворных строк, более 17 тысяч стихотворений 101 поэта. Это второй в мире поэтический корпус, снабженный лингвистической и стиховедческой разметкой, после поэтического корпуса русского языка. Корпус позволяет исследователю производить быстрый поиск интересующей его информации в большом массиве текстов. Так как слова в башкирских текстах снабжены переводом на русский язык, корпусом могут воспользоваться не только специалисты по башкирской филологии, но и более широкий круг лингвистов при проведении типологических исследований.