[Node.js_4기] 최종프로젝트 2주차_GPT파인튜닝 (24/04/01)

2024. 4. 1. 21:18공부/내배캠 TIL

목차

 

1. 문제

2. 시도

3. 결과

4. 배운점

 

1. 문제 

 

문제라기 보다는 진행사항.

GPT로 프롬프트 작업하고, 원하는 형식에 맞게 응답 받는것 까지는 성공.

이제 본격적으로 학습시키기 시작

 

2. 시도 

 

데이터 찾기 - AI 데이터찾기 - AI-Hub (aihub.or.kr)

데이터셋은 위의 링크.

일단은 xlsx파일에 담긴 400여종의 식품으로 영양소, 칼로리 등을 받는것 까지 1차 목표로 진행.

 

3. 결과 

 

담당 튜터님과의 면담 - 

(일단 텍스트로 진행하고, 추후에 이미지 학습을 시킬 예정입니다. 그런데 용량이 커서 고민입니다.)

저희 파인튜닝에 기본 5테라씩 씁니다 이미지만 아마 데이터가 부족할거에요 여러 사이트에서
크롤링도 하고 챗 지피티로 이미지 재생성해서 유사 이미지 여러개로 더 만들어서 양 자체를 늘리기도 하고
절대적인 양이 필요함... 
유사한 작업을 하는 모델을 찾아서 쓰는것도?
이미 어느정도 튜닝이 된 모델 찾기가 어렵긴 해서... 

식품 관련해서 있긴 할 것 같아요.
일단 구글링 많이 해보시고요.
만약에 잘 안되면 사람 이미지가 아닌 것, 배경 말고 오브젝트만 뽑는 것 등을 앞에 레이어로 쌓아서 쓸 수 있을 것 같아요.
또, 프롬프트 양식이 너무 길어서 안나올 수도 있을 것 같아요(지금 10초정도 걸림.)
하나씩 뽑는걸로 일단 해보세요 칼로리만 뽑기 같은거.

 

4. 배운점 

 

이제 슬슬 작업이 본궤도에 오르기 시작했습니다.

{
                "음식명" : "",
                "에너지(kcal)" : "",
                "탄수화물(g)" : "",
                "당류(g)" : "",
                "지방(g)" : "",  
                "단백질(g)" : ""
                "칼슘(mg)" : "",
                "인(mg)" : "",
                "나트륨(mg)" : "",
                "칼륨(mg)" : "",
                "마그네슘(mg)" : "",
                "철(mg)" : "",
                "아연(mg)" : "",
                "콜레스테롤(mg)" : "",
                "트랜스지방(g)" : "",
            }

음식 명을 입력받아 위와 같은 형식으로 출력하고 있습니다.(일단은 turbo3.5)