본문 바로가기

AWS/PROJECT

[프로젝트] AWS Translate 사용 방법

728x90

AWS Translate는 머신러닝 서비스인가보다.. 카테고리가 머신러닝쪽에 있었음

Amazon Translate는 텍스트 번역 서비스, 고급 머신 러닝 기술을 사용하여 우수한 품질의 번역을 온디맨드 방식으로 제공합니다.

Amazon Translate를 사용하여 구조화되지 않은 텍스트 문서를 번역하거나, 여러 언어로 작업하는 애플리케이션을 만들 수 있습니다. 

 

다양한 언어를 지원한다. 물론 한글도 지원함!

 

 

실시간 번역

실시간 번역은 파파고같다. 문장을 입력하면 바로 번역을 해준다

 

 

배치 번역

내가 프로젝트에서 사용할 서비스이다.

S3 버킷에 파일을 업로드하면 파일을 번역해서 그대로 파일로 생성해준다 신기!

 

use case : 대용량 문서 모음 (최대 5GB 크기) 을 번역하려면 Amazon Translate 비동기식 배치 처리 작업을 사용합니다. 이 작업은 소셜 미디어 게시물, 사용자 리뷰와 같은 짧은 문서 모음이나 즉각적인 번역이 필요하지 않은 상황에 적합

지원 리전
  • 미국 동부(버지니아 북부)
  • 미국 동부(오하이오)
  • 미국 서부(오레곤)
  • 아시아 태평양(서울)
  • 유럽(프랑크푸르트)
  • 유럽(아일랜드)
  • 유럽(런던)
지원 파일 형식
  • 일반 텍스트.
  • HTML.
  • 워드 문서 (.docx).
  • PowerPoint 프레젠테이션 파일 (.pptx).
  • 엑셀 통합 문서 파일 (.xlsx).
  • XML 현지화 교환 파일 형식 (XLIFF) 파일 (.xlf). Amazon Translate 번역은 XLIFF 버전 1.2만 지원합니다.

지원하는 리전과 파일 형식이 정해져 있기 때문에 이를 알아보고 사용해야 한다..

그래서 json 파일 형식을 txt파일로 바꾸는 그런 작업을 실행해야 할 것 같기도 하다..

 

 

실행 방식

쏘 심플.. S3 버킷에 파일을 올리고 translate에서 그 버킷을 찾아서 연결해주면 된다

번역되는데 시간이 좀 걸리는 편!

 

 

1. S3 버킷에 번역하고 싶은 파일 업로드하기

S3 버킷을 생성하고 파일을 업로드한다. 여기서 주의할 점이, 버킷 내에 바로 .docx 등 번역 파일을 올려선 안된다

버킷 내에 폴더 안에 파일이 있어야 한다!!

예를 들어 이런 식 : myfolder/translate-wish.docx

검정색이 버킷이고 버킷 내에 폴더 객체(회색표시)가 있는 것을 확인할 수 있다.

 

회색으로 표시된 폴더에 들어가면 내가 번역하고 싶은 docx파일이 있음을 확인할 수 있다

 

 

2. AWS Translate에서 배치번역 생성

이름과 소스 언어를 선택해준다

 

입력 S3 위치를 설정해준다

형식은 s3:/my-bucket/my-folder/ 이다

 

파일 형식도 지정해준다

 

입력 S3와 출력 S3는 서로 달라야한다.

만약, 입력 데이터가 s3:/my-bucket/my-folder/ 에 있다고 한다면, 출력 데이터는 s3:/my-bucket으로 연결되어도 된다!

 

마지막에 IAM Role도 지정해주어야 한다!!

 

 

3. 작업을 기다리면 실행 완료

얼마 안 되는 문서였지만, 17분이 걸린 것을 확인할 수 있다

 

결과를 확인해볼까?

파일은 내가 강릉 맛집을 찾은 것이다..ㅎㅎ

그저 번역만 해서 나열한 것이 아닌, 파일 형식에 맞추어 새로운 언어의 파일이 생성된 느낌이다!

 


그저 신기방기..

이제 이걸로 lambda를 이용해 자동으로 번역 작업을 실행할 수 있는지 보고,

json 파일 형식이 되는지 확인..(안 될 것 같긴한데 안되면,,..json->txt로 변환해야지^^.,,)

728x90