openAI GPT4 Vision 시각정보 API 사용해보기 > 개발관련
개발관련

openAI GPT4 Vision 시각정보 API 사용해보기

조회 728회 댓글 0건
  • 현재 페이지 주소 복사
  • 페이스북으로 공유
  • X 로  공유
  • 트위터로  공유
  • 네이버 블로그로 공유
  • 네이버 카페 공유하기
  • 네이버 라인 공유하기
  • 네이버 밴드 공유하기
  • 링크드인으로 공유하기
  • 핀터레스트에 공유하기

앞으로 3년만 지나도 참 많은 것이 변해 있을것 같습니다.

지금도 GPT4는 쓸만 합니다. 3.5 버전 까진 사실 뭐 그렇구나. 글은 좀 쓰는 구나 그런데 4버전은 간단한 함수 같은 것은 뚝딱 입니다.


GPT4에 눈을 달아준 비전 브리뷰를 API를 통해서 사용해 보았습니다.

사진 정보 이용 할 때는 빠른 처리를 위해서 해주는 것이 있는데 여기서도 그렇습니다. 그렇기 때문에 사용하실 분은 어떻게 축소 되는지 설명이 있으니 반드시 읽어 보셔야 합니다.


아래 curl 사용하여 잘 되는지 테스트하기 쉬운 예 입니다.

그리고 예제를 복사해 올때 어퍼스트로피 같은것이 문제가 되는 경우가 있으니 특수문자가 될만한것이 질문에 포함되어 있다면 자세히 보시고 뺀 다음 테스트해 보시면 됩니다.



  # 한글이 들어가면 utf8로 넣어줘야 합니다.
  #   - 아래 openAI 에서 발급 받은 API키는 본인것을 넣어 주면 됩니다.
  #   - 한글로 물어보면 결과가 한글로 나오는데 쉘에선 인코딩 된것으로 리턴 받는다.
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer API키" \
    -d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'
 


vscode에 있는것 긁어서 붙였더니 짤리네요. 위에 데이터에 해당하는 부분입니다.

-d '{"model":"gpt-4-vision-preview","messages":[{"role":"user","content":[{"type":"text","text":"새가 몇 마리"},{"type":"image_url","image_url":{"url":"https://cdn.pixabay.com/photo/2014/11/21/15/39/grey-crowned-cranes-540657_1280.jpg","detail":"high"}}]}],"max_tokens":300}'


그리고 위 예제는 첨부된 링크 타고 들어가면 "빠른시작" 부분에 있는 예제 입니다. 

거기서 curl 선택하면 나오는것에 몇 글자만 변경한 것입니다.




  # 위 쉘에서 받은것 한글 확인해야 하고자 할때는 아래 처럼 디코딩 하여 확인 하면 한글을 볼 수 있다.
  // \ub9cc\uc57d \uc6f9 형태로 나오는 것은 아래 함수를 사용하면 한글 utf-8로 나온다.
  $data = '...';
  $aJson = json_decode($data, true);
  print_r($aJson); exit;  
 


아래는 이번에 새로나온 달리3를 한글로 말했더니 아래것을 보여주네요



 

왜 무섭게? 생긴놈이 나왔지!! 물론 3개는 이것과는 완전 다릅니다. 

앞으로 왠만한것은 틀에 잘 맞춰서 자동으로 해주는것이 많을듯. 글씨 못써도 컴퓨터 워드프로세스 쓰면 틀만 잘 맞추면 누가 작성한 문서이든 별 차이 없는것 처럼.


● 참고자료

  - PHP사용시 API 사용에 필요한 부분 정리된것


 



  • 현재 페이지 주소 복사
  • 페이스북으로 공유
  • X 로  공유
  • 트위터로  공유
  • 네이버 블로그로 공유
  • 네이버 카페 공유하기
  • 네이버 라인 공유하기
  • 네이버 밴드 공유하기
  • 링크드인으로 공유하기
  • 핀터레스트에 공유하기
전체 231건 1 페이지
  • profile_image 코드자동완성 테스트한 vscode용 확장 프로그램 continue 다운로드 사용자가 엄청나게 많은데 ... 결론 부터 말하면 실패입니다. 아래 설정이 약간 잘못 되었을수 있겠지만.채팅은 잘 되는데 코드 자동완성이 잘 안됩니다.하지만 테스트 하고 싶은분 그리고 제가 나중에 다시 테스트 해볼 경우 필요할 수 있어 올리는 글입니다. 위 이미지에서 Main Config 라고 마우스 올리면 그 옆에 톱니가 나오는데 그걸 클릭해야 합니다.잘못 만들어져서 화면이 겹치는 문제가 있습니다.제 설정은 위 이미지에 대한것은 아래와 같습니다.name: lmstudioversion: 1.0.0schema: v1models:&…
  • profile_image 내가 준 먹이를 소화해서 다른 사용자에게 주면 곤란한 문제가 생길것 같아 직접 이용해 보기로 했습니다.결론 부터 말하면 잘하는 인공두뇌에 먹이 주면서 사용하는것이 낳으니 테스트 해보고 싶으신 분들을 위해서 남기는 글 입니다.사용한 확장 프로그램    twinny - AI Code Completion and Chat    Identifier: rjmacarthy.twinny 위처럼 설정하고 자신에 맞게 모델이나 IP주소 같은것만 변경해주면 됩니다.전 UI가 좋은 LM스튜디오 사용.이걸 빠르게 사용하려면 애플 실리콘 M5 Max 노트북 16인치 추천합니다.램은 최소 64G 가능하…
  • profile_image 무슨일인지 업그레이드 실패까지 생겼는데.... 왠지 모르지만 안되는게 참 많습니다.이런 경우 다시 설치하면 되긴 합니다.아마도 추측은 초기 설치 할 때 전체 사용자 선택을 해서 설치 했는데 업그레이드는 현재 유저 기준으로 해서 그런것이 아닌가 싶습니다. old 라고 된것 삭제 삭제하고new_ 이렇게된것 new_ 삭제하고 다시 실행하고 vscode에서 Help > Check for Updates 해주고 다시 시작하면 됩니다.이때 작업표시줄에 고정한게 있으면 그것 클릭하지 말고(삭제하고) 새로 설치된 아이콘 클릭해서 실행 하면됩니다.
  • profile_image vscode 사용하면 안되는것이 참 많지요.잘 되던것도 안되고 무료가 이런게 문제인데... 유료로 갈아 타려 했는데 매달 비용발생 때문에 ...어떤 것은 그것을 또 배워야 되서 할일도 못하는데 공부해야 되고 ...우선 그때 그때 수정해서 사용합니다.▷ 파일이 열리지 않는 원인은?natizyskunk SFTP 확장(1.16.3)에 내장된 구버전 ssh2 라이브러리가 Node.js의 util 모듈에서 isDate 함수를 가져다 쓰는데최신 VS Code 1.123.0이 이전에 제공되던 'isDate' 함수를 제거하면서 잘 작동하던 프로그램에 문제가 발생그래서 SFTP 연결(목록 조회)은 되지만 실제로 파일을 열거나 다운로드할…
  • profile_image 기본적인 특징은 아래와 같으며 사용 가능한지 어떤지 테스트 하면서 정리(테스트) 한것을 다음에 필요 할 수 있어 기록해 둡니다.이 파일 디비는 동시 처리하는데 문제가 있어 동시 처리 사용하고 싶으면 MySQL 같은 것 사용해야 됩니다.이게 MySQL과 명령이 비슷한것인가요? ANSI SQL 이라서 그런가요? 후자 인데요.SQL 문법은 ANSI SQL 나머지 CLI 도구 명령들은 각 DBMS에 따라 다른 경우라고 보면 됨.  - 파일 하나가 곧 데이터베이스 (.db, .sqlite). 그렇기 때문에 DBMS서버 필요 없는 경우 유용함.- 서버 없이 동작하는 경량 임베디드 RDBMS- Android, iO…
  • profile_image 하네스 엔지니어링 결론부터 말하면 개발 기획자는 별도로 할것 없이 기존에 하던데로 그냥 하면 됩니다.이것, 저것, 문제가많네~ 이런식으로 특정하지 않는 형태로 이쁘게 만들어줘 하는 방식이 문제가 있는것으로 이렇게 언급하는 방식은 현재 사람도 의도 파악을 정확히 모르기 때문에 원하는 결과가 나오지 않습니다.문제가 많아 - 어떤 문제가 많은지 구첵적으로 알려 줘야 해결 가능.이렇게 해석해도 큰 무리가 없는것으로 어떤 문제가 있는지 명확하게 알려줘야 개선이 되고 같은 문제가 생기지 않습니다. 예를 들면.1) 상태값 기록을 위해서 테이블에 시간과 현재 상태 기록해서 체크하는것을 만들어 달라고 했더니 만들긴 잘 만들었습…
  • profile_image 이건 백엔드는 데이터베이스등 서버개발이 유용한 측면들이 많죠.테스트 서버에서 작업하고 git으로 올리는 방법도 있고 git은 백업용도로만 사용하고 다중서버에 직접 올리는 방법도 있습니다.로컬의 편리한 UI + 서버의 강력한 자원 및 환경이 두 가지 토끼를 모두 잡을 수 있는 기능으로 저사양 노트북을 사용하더라도 강력한 클라우드 서버에 연결만 되어 있다면 그 서버의 성능을 내 것처럼 활용할 수 있게 됩니다.사용해 보시면 이런 좋은것을 이제 알았다니 할것입니다. 1. 로컬 환경과의 완벽한 분리 (Clean Local Machine)가장 큰 장점은 내 컴퓨터에 아무것도 설치할 필요가 없다는 것입니다.- 의존성 관리:…

상업적 이용 금지. 컨텐츠는 개인 용도로만 사용이 가능 합니다.