openAI GPT4 Vision 시각정보 API 사용해보기 > 개발관련
개발관련

openAI GPT4 Vision 시각정보 API 사용해보기

조회 26회 댓글 0건

앞으로 3년만 지나도 참 많은 것이 변해 있을것 같습니다.

지금도 GPT4는 쓸만 합니다. 3.5 버전 까진 사실 뭐 그렇구나. 글은 좀 쓰는 구나 그런데 4버전은 간단한 함수 같은 것은 뚝딱 입니다.


GPT4에 눈을 달아준 비전 브리뷰를 API를 통해서 사용해 보았습니다.

사진 정보 이용 할 때는 빠른 처리를 위해서 해주는 것이 있는데 여기서도 그렇습니다. 그렇기 때문에 사용하실 분은 어떻게 축소 되는지 설명이 있으니 반드시 읽어 보셔야 합니다.


아래 curl 사용하여 잘 되는지 테스트하기 쉬운 예 입니다.

그리고 예제를 복사해 올때 어퍼스트로피 같은것이 문제가 되는 경우가 있으니 특수문자가 될만한것이 질문에 포함되어 있다면 자세히 보시고 뺀 다음 테스트해 보시면 됩니다.



  # 한글이 들어가면 utf8로 넣어줘야 합니다.
  #   - 아래 openAI 에서 발급 받은 API키는 본인것을 넣어 주면 됩니다.
  #   - 한글로 물어보면 결과가 한글로 나오는데 쉘에선 인코딩 된것으로 리턴 받는다.
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer API키" \
    -d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'
 


vscode에 있는것 긁어서 붙였더니 짤리네요. 위에 데이터에 해당하는 부분입니다.

-d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'


그리고 위 예제는 첨부된 링크 타고 들어가면 "빠른시작" 부분에 있는 예제 입니다. 

거기서 curl 선택하면 나오는것에 몇 글자만 변경한 것입니다.




  # 위 쉘에서 받은것 한글 확인해야 하고자 할때는 아래 처럼 디코딩 하여 확인 하면 한글을 볼 수 있다.
  // \ub9cc\uc57d \uc6f9 형태로 나오는 것은 아래 함수를 사용하면 한글 utf-8로 나온다.
  $data = '...';
  $aJson = json_decode($data, true);
  print_r($aJson); exit;  
 


아래는 이번에 새로나온 달리3를 한글로 말했더니 아래것을 보여주네요


3a431b4e617b1cc09be8a09a9296fb78_1700282005_0459.png
 

왜 무섭게? 생긴놈이 나왔지!! 물론 3개는 이것과는 완전 다릅니다. 

앞으로 왠만한것은 틀에 잘 맞춰서 자동으로 해주는것이 많을듯. 글씨 못써도 컴퓨터 워드프로세스 쓰면 틀만 잘 맞추면 누가 작성한 문서이든 별 차이 없는것 처럼.




  • 페이스북으로 공유
  • 트위터로  공유
  • 구글플러스로 공유
전체 152건 1 페이지
  • profile_image 당연히 개발자라 해도 사람입니다. 그리하여 실수는 누구나 할 수 있습니다. 그러나 중요한 것은 실수를 극복하고, 그로부터 배우는 것입니다. **실수 인정**우선, 실수를 인정하는 것이 중요합니다. 실수를 부인하려고 하거나 무시하려고 하면 문제 해결에 방해가 됩니다.아래의 경우는 라이브러리 문제일 수도 있고 여러가지 상황이 많을 수 있는데요.대용량의 파일 다운로드 테스트가 이루어지지 않아서 그렇습니다.은근히 실수가 많은 것중 하나 입니다. 메일이…
  • profile_image ● 아래와 같은 이미지매직의 명령이 있을 때convert ${WRT_FILE} -crop 665x540+460+982우린 흔하게 앞쪽이 좌표 뒤쪽이 자를 크기라고 생각을 하는데우리라기 보다 제가 그렇습니다. 만드신분들이 사는 나라는 반대라서 아래와 같습니다.`-crop 665x540+460+982` 명령어에서, 'crop'은 이미지를 잘라내는 기능을 가리킵니다. 이때, 숫자들은 각각 다음과 같은 의미를 가집니다:▶  `665x540`은 잘라낼 …
  • profile_image Oracle VM에서 호스트 시스템으로 돌아가려면 'Right Ctrl' 키를 누르면 됩니다. 이 키는 'Host Key'라고도 불리며, 기본적으로 오라클 VM의 키보드 입력을 캡처하거나 해제하는데 사용됩니다.  이 키 설정이 마음에 들지 않는다면, VM의 설정 메뉴에서 '입력' -> '가상 머신' -> '호스트 키 조합'으로 가서 원하는 키로 변경할 수 있습니다.위 'ACPI 종료' 여기 입력할 수 있게 된것은 캡쳐 하면서 …
  • profile_image 찾아서 변경하기 기능에서 문서 전체를 대상으로 하는것이 아니라내가 선택한 부분만 변경하는 방법에 대한 것입니다.보통의 에디터들은 체크박스로 선택하는것이 있어 시각적으로 확인이 쉬운데 vscode는 이 부분이 디자인 측면을? 신경 써서 그런지 처음 사용하시는 분들은 찾기 쉽지 않습니다.선택된 부분의 것만 변경하고 싶을때는 화살표 위,아래 표시 옆에 있는것을 선택 한 다음 하시면 됩니다.일반 에디터처럼 좀 크게 패널을 열어서 체크박스로 선택 하는 …
  • profile_image vscode를 별도의 개별 프로그램으로 2개 실행하는 방법에 대한 것인데요. 서로 다른 용도로 사용하는 방법도 있겠습니다.예를 들면 자동완성이 되는데 겹치는 문제로 서로 다른 언어의 설정을 하여 사용하는 방법이 있겠고.따른 예는 euc-kr 과 utf-8 파일을 여는데 현재 vscode는 제대로 인식을 하지 못하여 잘못 여는 문제가 있는데 기본 캐릭터셋 설정을 서로 다르게 하여 문제가 발생 되지 하는 방법이 있겠습니다.Download Visua…
  • profile_image 전체적으로 명확한 표준이 있는것은 아닌 마크다운입니다.마크다운은 쉬운 HTML 작성기로 간단한 문서를 작성할때는 텍스트로 작성하기 때문에 참 유용합니다.GUI가 안되는 리눅스의 쉘에서 텍스트 파일 열어서 확인도 가능하도 수정하기도 쉽기 때문입니다.아래는 HTML의 CSS에 해당하는 부분으로서 마크다운의 표준은 아니지만 사용하고 있는 마크다운에서 잘 표현해주고 대체로 표현은 해주는 편으로 올립니다.색 변경하는 정도는 필요하기 때문입니다.마크다운에…