자연어 처리를 위한 허깅페이스 트랜스포머 하드 트레이닝
기술의 발전이 너무도 빠릅니다.
기술의 급류 속에 우리 개발자들 혹은 연구자들은 어쩔 수 없이 이를 따라갈 수 밖에 없으며,
관련 지식이 없다면 따라가기는커녕 휩쓸리거나 튕겨나가기 마련입니다.
자연어 처리를 공부하는 분들에게 "자연어 처리를 위한 허깅페이스 트랜스포머 하드트레이닝"이
기반 지식이 되어 급류를 헤쳐나가는 방법을 전하는 지침서가 되었으면 합니다.
허깅페이스 학습
허깅 페이스를 통해 오픈소스 모델을 활용해보고 싶은 사람들이 있다면 가장 먼저 읽어보아야 할 책입니다. 모든 기술이 다 그렇지만, LLM 기술이 처음 등장했을 때는 학습자료들이 대부분 영어로 작성되어 있어서 접근성이 떨어지고, LLM을 실제로 적용시키는데 어려움이 있었습니다. 책 앞부분에 쓰여있듯이, 대부분의 인공지능 관련도서들이 챗GPT나 프롬프트 엔지니어링 위주로 출간되는 경향이 있는데, 이 책은 자연어처리와 LLM에 대해 이해하기 쉽게 쓰여져있어 누구든지 LLM 학습에 필수적인 허깅 페이스 플랫폼을 중심으로 학습할 수 있도록 참고서로서의 기능을 톡톡히 수행할 것입니다.
책에서 허깅페이스를 소개하는 부분을 잠깐 소개하겠습니다. 자연어 처리나 이미지, 영상, 음성 등 다양한 분야에서 모델 학습 시에 사전 학습된 모델을 사용하다 보면 가장 많이 접하는 것이 '허깅 페이스'입니다. 허깅페이스는 초기에 자연어 처리를 기반으로 성장했지만, 서서히 규모가 커지면서 다양한 분야를 지원하는 라이브러리로 변모했습니다. 이 허깅페이스를 통해 다른 개발자들의 모델을 사용할 수도 있고, 본인의 모델을 허깅페이스에 올릴 수도 있습니다. 모델을 직접 커스터마이징 하기 위해서는 소스코드에 대한 이해가 필요한데, 이 책은 그 과정을 책을 통해 가능하도록 합니다.
학습에 도움이 되는 친절한 설명
보통의 실습용 도서의 경우 환경 구축 및 코드의 실행 결과를 소개하는 부분은 간단하게 넘어가는 경우가 많아 학습에 혼란이 생기는 경우가 종종 있는데, 이 책은 허깅페이스를 공부하고자 하는 누구든지 따라하면서 학습할 수 있도록 설치방법, 코드 실행 과정과 결과, 조정하는 방법등을 친절하게 소개해놓았습니다. 특히, 모델 크기와 성능이 선형적인 관게를 가지는 트랜스포머 기반 모델 특성상 크기가 증가하게 되면서, 모델의 메모리 사용량을 줄이고 추론 속도를 증가시키는 방법이 필요한 경우가 많습니다. 책의 7번째 파트에서는 다양한 종류의 모델 경량화 기법들을 예시와 함께 설명해 놓았는데, 모델 학습 시에 이 방식들을 적용시켜 학습시킨다면 거대한 규모의 모델도 효율적으로 추론이 가능할 것입니다.
다년간 NLP 엔지니어 및 자연어 처리 개발자로 활동한 저자들의 경험이 이 책에 녹아있어 다른 책보다도 이해하기 쉬운 LLM 학습서라고 생각합니다. 자연어 처리를 위한 허깅페이스를 공부해보고 싶은 사람들이 있다면, 가장 먼저 읽어보면 좋을 책입니다.