개발관련

openAI GPT4 Vision 시각정보 API 사용해보기

조회 233회 댓글 0건

앞으로 3년만 지나도 참 많은 것이 변해 있을것 같습니다.

지금도 GPT4는 쓸만 합니다. 3.5 버전 까진 사실 뭐 그렇구나. 글은 좀 쓰는 구나 그런데 4버전은 간단한 함수 같은 것은 뚝딱 입니다.

GPT4에 눈을 달아준 비전 브리뷰를 API를 통해서 사용해 보았습니다.

사진 정보 이용 할 때는 빠른 처리를 위해서 해주는 것이 있는데 여기서도 그렇습니다. 그렇기 때문에 사용하실 분은 어떻게 축소 되는지 설명이 있으니 반드시 읽어 보셔야 합니다.

아래 curl 사용하여 잘 되는지 테스트하기 쉬운 예 입니다.

그리고 예제를 복사해 올때 어퍼스트로피 같은것이 문제가 되는 경우가 있으니 특수문자가 될만한것이 질문에 포함되어 있다면 자세히 보시고 뺀 다음 테스트해 보시면 됩니다.

  # 한글이 들어가면 utf8로 넣어줘야 합니다.
  #   - 아래 openAI 에서 발급 받은 API키는 본인것을 넣어 주면 됩니다.
  #   - 한글로 물어보면 결과가 한글로 나오는데 쉘에선 인코딩 된것으로 리턴 받는다. 
  curl https://api.openai.com/v1/chat/completions \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer API키" \
    -d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'

vscode에 있는것 긁어서 붙였더니 짤리네요. 위에 데이터에 해당하는 부분입니다.

-d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'

그리고 위 예제는 첨부된 링크 타고 들어가면 "빠른시작" 부분에 있는 예제 입니다.

거기서 curl 선택하면 나오는것에 몇 글자만 변경한 것입니다.

  # 위 쉘에서 받은것 한글 확인해야 하고자 할때는 아래 처럼 디코딩 하여 확인 하면 한글을 볼 수 있다.
  // \ub9cc\uc57d \uc6f9 형태로 나오는 것은 아래 함수를 사용하면 한글 utf-8로 나온다. 
  $data = '...';
  $aJson = json_decode($data, true); 
  print_r($aJson); exit;  

아래는 이번에 새로나온 달리3를 한글로 말했더니 아래것을 보여주네요

왜 무섭게? 생긴놈이 나왔지!! 물론 3개는 이것과는 완전 다릅니다.

앞으로 왠만한것은 틀에 잘 맞춰서 자동으로 해주는것이 많을듯. 글씨 못써도 컴퓨터 워드프로세스 쓰면 틀만 잘 맞추면 누가 작성한 문서이든 별 차이 없는것 처럼.

● 참고자료

- PHP사용시 API 사용에 필요한 부분 정리된것

관련링크

https://platform.openai.com/docs/guides/vision

전체 160건 1 페이지

윈도우 네트워크에서 ping 문제 없으며 dns 설정까지 확실하게 문제가 없는데 안되는 경우

확실하게 설정에 문제가 없는 경우에 해당 하며 잘 되다가 갑자기 안된경우에만 해당 됩니다. 먼저 ping를 게이트웨이 까지 체크하고 그 다음 인터넷으로 나가는 ping 까지 문제 없는 경우.그런데 ping www.naver.com 했는데 인터넷주소(IP)가 나오지 않는 경우1. ipconfig /flushdns 명령을 내려봅니다.2. 위 명령으로도 안된다면 초기화 명령을 내립니다.주의할 점은 초기화 되어 다시 설정해야 하고 관리자 권한으로 명령…
윈도우의 CMD(컴앤드라인)에서 DNS 설정 상태를 보려면?

CMD (명령 프롬프트)에서 DNS 설정 상태를 확인하려면 ipconfig /all 실행하면 됩니다.그러면 네트워크 인터페이에 대한 전체 정보가 나오는데 DNS 서버 부분을 보면 됩니다. DNS 서버. . . . . . . . . . : 1.1.1.1 4.4.4.4그리고 DNS 쿼리의 작동 여부를 확인하려면nslookup 명령으로 nslookup www.google.com 을 입력 …
거북목 증후군을 미리 예방하자

아프지 않던 어깨나 목 등뼈 허리 등 언제 부터 인지 모르겠는데 이상하게 아픈 경우명절 처럼 긴 휴가를 지냈더니 아팠던 것이 없어진 경우분명한 자세 문제 입니다.아래는 전형적인 반듯한 자세 입니다.난 자세가 이렇다 하면 가끔 일어 나서 혈액 순환만 잘 되도록 밖에 잠깐 나갔다 오면 됩니다.대체로 책상, 의자, 모니터의 높이 조절이 필요합니다.권장하는 형태가 있지만 사람마다 다를 수 있으니 본인에게 맞는 형태를 찾는 것이 제일 좋습니다.● 모니터…
LLM이 거짓말을 하게 되는 이유는 본래 구조가 그렇기 때문이다.

원리를 알면 왜? 그런 현상이 있는지 알수 있습니다.대형 언어 모델(LLM) 소형언어 모델도 원리는 같기 때문에 어쩔 수 없는 부분인것으로 보입니다.단, 궁금한것이 우리 뇌도 나도 그런가?그건 아니죠. 그런것 같은게 있기는 한데 ...아래 그림을 보면 왜? LLM이 아무것이나 우선 대답을 하게 되는지 알 수 있습니다.어떤 것이든 가장 근접한 것을 내보내게 되어 있습니다.그래서 그렇습니다. 어느 일정 수치 이하이면 내보내지 않도록 하면 되겠지만 …
깃허브 100메가 넘는 파일(github 100MB 제한)

this exceeds GitHub's file size limit of 100.00 MB프로그램 파일은 아니고 가끔 정리하는것 백업으로 올리고 있는데 너무 큰 용량으로 인한 오류가 발생 했습니다.100메가 넘는 파일 때문에 문제가 발생 했는데 삭제 후 처리 하는 방법에 대한 것이다. nothing to commit, working tree cleanEnumerating objects: 57, done.Counting objects: 100% …
[vscode] 마크다운 작성시 이미지 쉽게 추가하는 방법

마크다운 작성시 편하게 이미지 넣는 방법 입니다.텍스트로 작성의 장점이 있고 VSCODE 사용에 익숙하기 때문에 마크다운을 자주 이용하는데 한가지 불편한 점이 이미지를 넣는것이었습니다.간단하게 작성할때는 이미지를 줄이거나 늘이지 않기 때문에 문제 되지 않습니다.확장 프로그램을 설치하면 되는데 paste Image 입니다.우리가 클립보드에 넣는 Ctrl + C 하고 Ctrl + V 하면 현재 마크다운 파일이 있는곳에 자동으로 이미지가 생성 됩니다…
엑셀에서 A 쉘에 있는 값을 이용해서 B 쉘에 규칙적인 외부 링크 걸기

엑셀에서 A 셀의 값을 이용하여 B 셀에 규칙적인 외부 링크를 만드는 것은 다음과 같은 방법으로 할 수 있다.하이퍼링크 수식 사용하기=HYPERLINK("https://www.example.com/Cform_" & trim(A1) & ".php", "Link to " & A1)- 이 수식은 A1 셀의 값을 URL의 일부로 사용하여 B 셀에 하이퍼링크를 생성합니다.- "http://www.example.com/"는 실제 링크…