구글 번역 API로 다국어 번역 자동화 파이프라인 구축하기

들어가며

글로벌 진출을 위해 다국어 번역 프로세스 재정비가 필요했다. 기존에는 개발자가 직접 JSON 파일을 관리했다. 키 설정, 번역 등은 모두 개발자가 임의로 진행했다. 키가 몇 개 없을 때는 그럭저럭 돌아갔지만, 서비스가 고도화되어가면서 점점 병목이 되어가고 있었다. 키를 추가하고 JSON 업데이트를 빠뜨리거나, 번역 결과를 잘못된 키에 넣는 실수가 언제든 일어날 수 있었다.

번역 프로세스를 재정립하고 자동화가 필요했다. SaaS 도입은 내부 사정 상 보류되었기 때문에 Google Translate API 기반으로 직접 구현이 필요했다.

다국어 자동 번역 파이프라인

전체 파이프라인은 다음과 같다.

S3에서 기존 번역 JSON 다운로드
코드를 스캔하여 번역 Key 추출 (i18next-scanner)
번역이 필요한 신규 Key 추출 (다국어 파일에 존재하지 않는 Key)
Google 스프레드시트에 추가
번역 (Google Translate API)
Google 스프레드시트에 번역 반영
Google 스프레드시트 기반으로 다국어 JSON 생성 후 프로젝트에 보관 (S3 업로드)

1단계: `TSX`를 스캔 가능한 형태로 변환 — Babel

코드를 스캔할 때 i18next-scanner 라이브러리를 사용했다. 이 라이브러리는 acorn 이라는 파서에 의존하고 있는데, 기본적으로 .js / .jsx 파일을 대상으로만 동작하기 때문에 TypeScript 파일을 스캔할 때는 제대로 동작하지 않았다. 따라서 스캔 전에 Babel로 TypeScript 문법을 제거해서 순수 JS로 변환하는 전처리 단계가 필요했다.

구글 번역 API로 다국어 번역 자동화 파이프라인 구축하기

들어가며

다국어 자동 번역 파이프라인

1단계: `TSX`를 스캔 가능한 형태로 변환 — Babel

2단계: 번역 키 추출 — i18next-scanner

패턴 1: 일반 t() 함수

패턴 2: Babel 트랜스파일 후 변형된 함수 호출

패턴 3: Trans 컴포넌트

3단계: 번역 및 동기화

S3에서 기존 번역 파일 동기화

i18next-scanner 실행

신규 키 필터링

Google Sheets에 신규 키 추가

자동 번역 (Google Cloud Translate API)

번역 결과를 Google Sheets에 반영

Google Sheets 기반으로 JSON 파일 생성

JSON 파일을 S3에 업로드

다국어 Key 설계

마치며

구글 번역 API로 다국어 번역 자동화 파이프라인 구축하기

들어가며

다국어 자동 번역 파이프라인

1단계: TSX를 스캔 가능한 형태로 변환 — Babel

2단계: 번역 키 추출 — i18next-scanner

패턴 1: 일반 t() 함수

패턴 2: Babel 트랜스파일 후 변형된 함수 호출

패턴 3: Trans 컴포넌트

3단계: 번역 및 동기화

S3에서 기존 번역 파일 동기화

i18next-scanner 실행

신규 키 필터링

Google Sheets에 신규 키 추가

자동 번역 (Google Cloud Translate API)

번역 결과를 Google Sheets에 반영

Google Sheets 기반으로 JSON 파일 생성

JSON 파일을 S3에 업로드

다국어 Key 설계

마치며

1단계: `TSX`를 스캔 가능한 형태로 변환 — Babel