Giannis Daras: Improving sparse transformer models for efficient self-attention (spaCy IRL 2019)

Arxiv 2021: Sparse attention PlanningПодробнее

Peter Baumgartner: Applied NLP: Lessons from the Field (spaCy IRL 2019)Подробнее

Sebastian Ruder: Transfer Learning in Open-Source Natural Language Processing (spaCy IRL 2019)Подробнее

Sparse Transformers - Tsvetomila Mihaylova [PyData Sofia April 2020]Подробнее

Giannis Daras - Generative Models and Comp. Imaging: Soft Diffusion and Learning from Corrupted DataПодробнее

Yoav Goldberg: The missing elements in NLP (spaCy IRL 2019)Подробнее

HPCA' SpAtten: Efficient Sparse Attention Architecture w/ Cascade Token/Head Pruning by Hanrui WangПодробнее

Adaptive Transformers in NLPПодробнее

Efficient TransformersПодробнее

McKenzie Marshall: NLP in Asset Management (spaCy IRL 2019)Подробнее

Use Sparse Transfer Learning to Create Sparse Models Fine-Tuned to Your DatasetsПодробнее

Big Bird: Transformers for Longer SequencesПодробнее

Is Sparse Attention more Interpretable?Подробнее