반응형

전체 글 36

RAG로 욕설 탐지를 할 수 있다??

안녕하세요 에이콘입니다.이직하고나서 정말 간만에 포스팅을 해보는데요,오늘은 RAG를 사용하여 욕설을 탐지하는 재밌는 주제를 가지고 왔습니다.  https://github.com/2runo/Curse-detection-data GitHub - 2runo/Curse-detection-data: 문장의 욕설 여부를 분류한 한글 데이터셋입니다.문장의 욕설 여부를 분류한 한글 데이터셋입니다. Contribute to 2runo/Curse-detection-data development by creating an account on GitHub.github.com우선 오픈소스에 있는 욕설 데이터셋을 가져옵니다. 데이터는 일간베스트(일베), 오늘의 유머와 같은 각종 커뮤니티 사이트의 댓글에 대해 총 5,825문장이 ..

Tech 2024.06.26

Direct Preference Optimization: Your Language Model is Secretly a Reward Model논문 리뷰.

안녕하세요 오늘 소개해드릴 논문 리뷰는 이미 많은 사람들이 리뷰한 논문인 Direct Preference Optimization: Your Language Model is Secretly a Reward Model입니다. 배경색은 의미를 내포하고 있습니다! 파란 배경 : 중요하다 생각하는 부분 빨간 배경 : 내 의견이 반영된 부분 기존 RLHF의 방법은 불안정한 절차, 사람의 견해가 들어간 비 일관성, 높은 리소스의 한계 등 여러 단점이 있었음. 하지만 DPO(직접 선호도 최적화) 방식을 통해 높은 안정성과 적은 리소스의 이점을 취하면서 본 논문에서 언급되겠지만, 일반적인 RLHF보다 좋은 퍼포먼스를 보여준다고 주장함. 논문 링크 : https://arxiv.org/abs/2305.18290 Direct..

paper review 2024.03.12

Large Language Models for Data Annotation: A Survey 논문 리뷰

안녕하세요 오늘 소개해드릴 논문 리뷰는 Large Language Models for Data Annotation: A Survey 입니다. 데이터 주석에 대한 다양한 관점에서 조사가 이루어졌고, 각 분야에 대한 최신 연구 동향을 소개해주는 논문입니다. 배경색은 의미를 내포하고 있습니다! 파란 배경 : 중요하다 생각하는 부분 빨간 배경 : 내 의견이 반영된 부분 논문 링크 : https://arxiv.org/abs/2402.13446 Abstract 데이터 주석은 머신러닝 모델의 성능을 향상시키기 위해 필수적인 과정입니다. 그러나 이 작업은 시간과 비용을 많이 소모합니다. 그렇기에 최신 LLM 모델인 GPT-4를 사용하여 자동화 하는 많은 방법론들이 탄생하고 있습니다. 이 백서는 데이터 주석을 위한 LL..

paper review 2024.03.05

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits 논문 리뷰

오늘 리뷰할 논문은 The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits입니다. Geeknews에서도 소개되었고, 유튜버 조코딩님께서도 라이브에서 언급했던 만큼 제법 이슈가 있고, 엣지 디바이스에서 LLM을 이용하여 서비스를 이용하고자 하는 사람들에게는 유용한 내용인 것 같아 소개해봅니다. 링크 https://news.hada.io/topic?id=13573 1비트 LLM 시대: 비용 효율적인 컴퓨팅을 위한 삼진 파라미터 | GeekNews 1비트 대형 언어 모델의 시대: 모든 대형 언어 모델은 1.58비트에 있다최근 연구인 BitNet은 1비트 대형 언어 모델(LLMs)의 새로운 시대를 열고 있음.이 연구에서는 모든 단일 매개변수(또는 가..

paper review 2024.03.05

L2P - LLM to Pico(1)

안녕하세요 민윤홍입니다. 오늘은 저희 회사 WIZnet의 제품인 W5500-EVB-Pico를 사용해서 OpenAI API를 호출하여 사용해보려고 합니다. W5500이 저렴한 가격에 S2E를 지원하는 제품인만큼, PC나 클라우드를 연동하여 사용하여 서비스를 구현하면 가격대비 굉장히 매력있는 컨텐츠가 나올 수 있다 생각합니다. 이미 STM32나 SparkFun Edge같은 제품의 경우 AIoT를 많은 부분에서 적용하였고, 실제로 많은 AIoT 컨텐츠들이 시중에 나와있으나, 아직 LLM과 보드를 융합시키는 움직임은 보이지 않는 것 같습니다. 그래서 저희 제품인 W5500-EVB-Pico를 사용해 정말 저렴하게 언어모델을 사용할 수 있는 방법에 대해 소개해보고자 합니다. https://maker.wiznet.i..

Tech 2024.02.19

모두의 연구소 방문 후기

안녕하세요. 저번주 토요일은 저에게 아주 바쁜 하루였습니다. 모두의 연구소에서 네트워킹과 공덕에서의 컨퍼런스 두가지 행사를 진행하였어요. 그중 모두의연구소 네트워킹의 경우 제가 오픈카톡방에서 가볍게 보낸 카톡 한 통에서 시작된 모임입니다...! 다행히 운영진분께서 좋게 봐주시고, 공간대여까지 해주셔서 모두의연구소 강남점에 들릴 기회가 생겼습니다! 다양한 사람들과 모여 제로콜라와 다과를 먹으며 이런저런 이야기를 하는 즐거운 시간을 가졌습니다! 제가 연구하고 있는 분야인 LLM과 TinyML에 대해 간략하게 세미나를 하고, 관련해서 인사이트를 나누는 시간도 가졌습니다. 같은 프롬프트 엔지니어분이 계셔서 성능개선 프롬프트, 페르소나 관련해서도 이야기를 나누고, 테스팅 관련해서도 많은 이야기를 나누는 시간이였습..

Conference 2024.02.12

나만의 챗봇 Service해보기(1) - 결과부터 보자.

안녕하세요. 개인 공부 겸 토이 프로젝트로 간단하게 챗봇 관련 서비스를 배포하는 프로젝트를 진행 해보았습니다. 이번 프로젝트는 LLM, 특히 RAG를 통한 CustomChatbot 제작을 위한 공부를 하고, Streamlit을 통해 서비스화 시키는 간단한 프로젝트 입니다, Streamlit은 데이터 사이언스와 머신 러닝을 위한 빠르고 사용하기 쉬운 앱 프레임워크입니다. Python 기반으로 작동하기 때문에, 저와 같은 개발자들에게 친숙한 환경에서 작업할 수 있었습니다. Langchain은 최신의 언어 모델을 사용하여 다양한 언어 작업을 수행할 수 있는 라이브러리입니다. 이 두 도구를 결합하여, 쉽고 빠르게 서비스화할 수 있는 챗봇 프로젝트를 제작하였습니다. 아래 사이트는 제가 제작한 챗봇 사이트입니다. ..

Tech 2024.02.11

챗봇 개발일지 - 데이터 정제 과정

안녕하세요! 즐거운 설날 연휴 보내고 있으신가요? 오늘은 챗봇 파인튜닝을 위한 데이터 정제 과정에 대한 심도 있는 분석을 공유하려 합니다. 데이터 정제는 고품질 챗봇 개발의 핵심 요소로, 본 글에서는 이 과정을 체계적으로 접근하는 방법을 탐구합니다. 아래는 제가 기획하면서 만들었던 prototype 설계 과정입니다. 혼자 화이트보드에 끄적이며 설계했던 과정. 먼저, 고객과 매니저 간의 일상적 대화를 효과적인 학습 데이터셋으로 변환하는 전처리 작업의 중요성을 강조하고자 합니다. 이 과정에서 다양한 전처리 방법론을 모색하고 GPT의 일반화 능력을 활용하여 이를 최적화하는 방안을 모색했습니다. 그래서 간단하게 GPTs를 통해 확인을 해보았습니다. 대화뭉치를 Q와 A로 구분해주는 GPTs 고객-엔지니어 대화 뭉..

Tech 2024.02.11

나만의 챗봇 Service해보기(2) : WIZnet Doc에 있는 데이터를 학습시키자!

안녕하세요! 오늘은 저번 시간에 이어서 나만의 챗봇을 학습하기 위한 데이터를 가져오는 방법을 알려드리려고 합니다. 우선 데이터를 구축하기 위한 예시로 WIZnet의 doc를 가져와봅시다. 아래 Github링크를 들어가면 WIZnet의 doc를 마크다운 파일로 확인할 수 있습니다. https://github.com/Wiznet/document_framework GitHub - Wiznet/document_framework Contribute to Wiznet/document_framework development by creating an account on GitHub. github.com 이중 W5500를 예시로 가져왔습니다. ## W5500 ![W5500 Photo 1](/img/products/w5..

Tech 2024.02.06
반응형