Brf формат

Added by Evgeny Kalishenko 12 months ago

Большая часть brf файлов на первый взгляд не соответствует оригиналу PDB по последовательности аминокислот. Например 1all.pdb и 1all.brf (приложены):
  • Различие числа аминокислот: 175 против 160
  • Несмотря на то, что в начале белки совпадают, ближе к концу соответствия аминокислот не прослеживается

1all.brf - Protein structures (3.8 kB)

1all.pdb - PDB protein (248 kB)


Replies (5)

RE: Brf формат - Added by Vladimir Karasev 12 months ago

Уважаемый Евгений!

Спасибо за сообщение. К сожалению и я с этим сталкивался. Различия связаны с использованием генетических файлов, которые раньше (эти файлы были сделаны давно) вследствие методических несовершенств, отличались от аминокислотных по белку. Выход такой: отберите те файлы. которые полностью совпадают, а остальные перебросьте в отдельную папку "Брак". В дальнейшем, по мере необходимости, можно будет наладить программный метод получения brf-файлов (но это позже, до середины июня я буду занят со своими студентками).
С наилучшими пожеланиями
В.А.

RE: Brf формат - Added by Evgeny Kalishenko 12 months ago

Владимир Александрович,
в целях развития проекта в части самообучающихся моделей возникла необходимость применять модель к достаточно большим белкам. В имеющемся наборе brf-файлов есть пара белков более 400 аминокислот, например 2cpp. Однако их очень мало и хотелось бы проанализировать белки с числом аминокислот порядка 1000. Возможно достаточно сложно каждый раз генерировать brf-файл, можете ли вы посоветовать форматы типа pdb, в которых несложным образом аннотируются структуры белка?

RE: Brf формат - Added by Vladimir Karasev 12 months ago

Уважаемый Евгений!
К сожалению не ожидал такого развития событий. У меня в банке из 2500 белков конечно, найдутся белки с большим количеством аминокислот, но их нужно искать (как автоматизировать - не знаю, а вручную как то не хочется). Если хотите - могу переслать запакованные белки и сказать на что обращать внимание при поиске. А когда наберете некоторое количество - могу подсказать, как написать простую программку для получения необходимых Вам файлов.
Жду Вашего запроса.

С наилучшими пожеланиями

В.А.

RE: Brf формат - Added by Evgeny Kalishenko 12 months ago

Vladimir Karasev wrote:

Уважаемый Евгений! К сожалению не ожидал такого развития событий. У меня в банке из 2500 белков конечно, найдутся белки с большим количеством аминокислот, но их нужно искать (как автоматизировать - не знаю, а вручную как то не хочется). Если хотите - могу переслать запакованные белки и сказать на что обращать внимание при поиске. А когда наберете некоторое количество - могу подсказать, как написать простую программку для получения необходимых Вам файлов. Жду Вашего запроса.

С наилучшими пожеланиями

В.А.

Найти длинный белок не проблема, в тех данных что есть у нас это делается простой сортировкой фалов по числу строк :) Насколько большой размер базы, реально её пересылатьпо почте или выложить на файлообменник? Сейчас изучаем возможность определения типа структуры по PDB формату (структуры типа HELIX...)

RE: Brf формат - Added by Vladimir Karasev 12 months ago

Уважаемый Евгений!

Я подготовил 5 пакетов файлов. Для пробы высылаю один из них.
Чтобы правильно ориентироваться в количестве аминокислот найдита в каждом из файлов строку

SEQRES 1 A 106
или
SEQRES 1 A 330

В ней последние цифры означают количество аминокислот в белке. Так Вы легко рассортируете белки по числу аминокислот.
Сообщайте, как скачался файл.

С наилучшими пожеланиями
В.А.

(1-5/5)