본문 바로가기

분류 전체보기71

인간 vs. AI 정규표현식 문제 풀이 대결 AI와 자연어처리에 깊은 관심을 갖고 있는 만큼 관련 도서를 읽는 것을 매우 좋아합니다. 오랜 시간 동안 독서에 시간을 투자한다고 말하기엔 부족하지만, 책을 통해 새로운 지식을 얻는 것은 언제나 즐겁고 유익한 일입니다. 그런데 우연한 기회에 제이펍 인스타그램 게시글을 통해 '인간 vs. AI 정규표현식 문제 풀이 대결' 이라는 책을 보게 되었고, 서평단을 모집한다는 소식에 곧장 지원했습니다. 며칠 뒤 정말 감사하게도 서평단에 선발되었고 주어진 기간 동안 책을 읽은 후 리뷰하게 되었습니다. 사실 정규표현식의 기능 자체는 정말 강력하지만, 흔히 사용되는 문법이냐고 묻는다면 자신있게 답하기가 어렵습니다. 제가 경험이 부족하기 때문일 수도 있지만, 일반적인 개발 과정에서 자주 사용되는지는 모르겠습니다. 정규표현.. 2023. 10. 17.
[논문리뷰] Efficient Estimation of Word Representations in Vector Space word2vec을 처음 제안한 논문인 Efficient Estimation of Word Representations in Vector Space를 읽고 리뷰하였습니다. 논문에서는 사실 word2vec이라는 표현이 어디에서도 사용되지 않는데, 나중에 알고 보니까 저자인 Mikolov와 그의 구글 팀원들이 배포한 소프트웨어 패키지의 이름이라고 합니다. 이 패키지는 논문에서 구현한 알고리즘을 담고 있기 때문에, 이 툴이 인기를 얻으면서 word2vec이라는 이름이 널리 퍼지게 되었습니다. 번역을 통해 오히려 이해가 어려워지거나, 원문의 표현을 사용하는 게 원래 의미를 온전히 잘 전달할 것이라고 생각하는 표현은 원문의 표기를 따랐습니다. 오개념이나 오탈자가 있다면 댓글로 지적해주세요. 설명이 부족한 부분에 대.. 2023. 10. 17.
파이썬의 dis 모듈 최근 파이썬 3.12 버전이 공개되면서 몇 가지 변경점이 소개되었습니다. 자세한 내용은 공식 문서를 통해 확인할 수 있고, Real Python에서 각각에 대해서 조금 더 이해하기 쉽게 풀이한 내용을 볼 수 있습니다. 해당 글에는 Faster Python: More Specializations and Inline Comprehensions라는 섹션이 있습니다. 거기에 dis라는 모듈이 언급되는데 그 역할이 흥미로워서 간단하게 정리해보았습니다. dis는 CPython 바이트코드를 분해하고 분석할 수 있도록 하는 모듈입니다. 이 모듈이 입력받는 CPython 바이트코드는 include/opcode.h 파일에 정의되어 있으며 컴파일러와 인터프리터에서 사용됩니다. 바이트코드는 CPython 인터프리터의 구현 세.. 2023. 10. 16.
GPT-5에 대한 다양한 소식 ChatGPT가 등장한 이후 GPT-4를 비롯한 그 이후의 행보에 대한 관심이 계속해서 커졌습니다. 이와 관련하여 GPT-5에 대한 흥미로운 소식을 접하게 되어 정리해보았습니다. 먼저 GPT-4이 발표된 지 얼마 되지 않은 올해 3월 22일에 인공지능 연구를 중단해야 한다는 선언이 발표되었습니다. Pause Giant AI Experiments: An Open Letter라는 제목의 성명이 널리 퍼졌고, 요슈아 벤지오, 스튜어트 러셀, 일론 머스크, 스티브 워즈니악, 유발 하라리 등 상당 수의 각계 권위자들이 서명에 동참하였습니다. 그 내용을 간단하게 요약하면 다음과 같습니다. Demis Hassabies, Yann Lecun, Yoshua Bengio 등 저명한 인사들이 서명한 Asilomar AI 원.. 2023. 10. 16.