Mechanistic Interpretability — Никита Балаганский, Т-Банк

Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении. В докладе Никита рассказал, чем его группа занимается прямо сейчас в направлении механистик интерпретабилити. #nlp #ml #тбанк

405 views

329