Skip to content

Illy-team/AI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

3 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

AI

곡고 μΆ”μ²œμ„ μœ„ν•œ Transformer(BERT) based NLP modeling

μœ μ €μ˜ ν¬νŠΈν΄λ¦¬μ˜€μ™€ μ±„μš© 곡고, λŒ€μ™Έν™œλ™, 곡λͺ¨μ „λ“± 컀리어와 κ΄€λ ¨λœ ν™œλ™μ„ μΆ”μ²œν•΄μ£ΌκΈ° μœ„ν•΄ μžμ—°μ–΄λΆ„μ„(NLP) 기법이 ν•„μš”ν•©λ‹ˆλ‹€

BERT(Bidirectional Encoder Representations from Transformers) λͺ¨λΈμ€ λ‹€μŒκ³Ό 같은 κ²°κ³Όλ₯Ό κ°–μŠ΅λ‹ˆλ‹€.

  1. μ–‘λ°©ν–₯ μ»¨ν…μŠ€νŠΈ 이해: BERTλŠ” λͺ¨λ“  단어λ₯Ό μ£Όλ³€ λ‹¨μ–΄μ˜ λ§₯λ½μ—μ„œ λ™μ‹œμ— 이해할 수 μžˆλŠ” μ–‘λ°©ν–₯ 트랜슀포머 ꡬ쑰λ₯Ό μ‚¬μš©ν•©λ‹ˆλ‹€. μ΄λŠ” μ΄μ „μ˜ 단방ν–₯ λ˜λŠ” 뢀뢄적 μ–‘λ°©ν–₯ λͺ¨λΈκ³Ό λΉ„κ΅ν•˜μ—¬ λ¬Έμž₯의 의미λ₯Ό 더 잘 νŒŒμ•…ν•  수 있게 ν•΄μ€λ‹ˆλ‹€.
  2. 전이 ν•™μŠ΅μ˜ μš©μ΄μ„±: BERTλŠ” λŒ€κ·œλͺ¨ ν…μŠ€νŠΈ μ½”νΌμŠ€λ‘œ 사전 ν•™μŠ΅λœ ν›„, μ†ŒλŸ‰μ˜ λ°μ΄ν„°λ‘œ λ―Έμ„Έ 쑰정을 톡해 λ‹€μ–‘ν•œ NLP μž‘μ—…μ— 적용될 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” μƒλŒ€μ μœΌλ‘œ μž‘μ€ λ°μ΄ν„°μ…‹μœΌλ‘œλ„ 높은 μ„±λŠ₯을 달성할 수 있게 ν•΄μ€λ‹ˆλ‹€.
  3. λ‹€μ–‘ν•œ NLP μž‘μ—…μ—μ„œμ˜ 높은 μ„±λŠ₯: BERTλŠ” μžμ—°μ–΄ 이해(NLU) μž‘μ—…λΏλ§Œ μ•„λ‹ˆλΌ, 질의 응닡(QA), 감정 뢄석, ν…μŠ€νŠΈ λΆ„λ₯˜, 이름이 μ§€μ •λœ μ—”ν‹°ν‹° 인식(NER) λ“± λ‹€μ–‘ν•œ μž‘μ—…μ—μ„œ νƒμ›”ν•œ μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
  4. μ–Έμ–΄ λͺ¨λΈμ˜ μƒˆλ‘œμš΄ κΈ°μ€€ μ„€μ •: BERTλŠ” λ§Žμ€ NLP λ²€μΉ˜λ§ˆν¬μ—μ„œ μƒˆλ‘œμš΄ 졜고 기둝을 μ„Έμ› μœΌλ©°, 이후 λ“±μž₯ν•œ λ§Žμ€ λͺ¨λΈλ“€μ΄ BERTλ₯Ό 기반으둜 λ°œμ „ν•˜μ˜€μŠ΅λ‹ˆλ‹€.
  5. 높은 μ΄ν•΄λ„μ˜ μ–Έμ–΄ ν‘œν˜„: BERTλŠ” 단어, λ¬Έμž₯, 그리고 κ·Έ μ‚¬μ΄μ˜ 관계λ₯Ό ν¬ν•¨ν•œ ν’λΆ€ν•œ μ–Έμ–΄ ν‘œν˜„μ„ ν•™μŠ΅ν•©λ‹ˆλ‹€. μ΄λŠ” λ³΅μž‘ν•œ μ–Έμ–΄ 이해 μž‘μ—…μ„ μˆ˜ν–‰ν•  λ•Œ μœ λ¦¬ν•©λ‹ˆλ‹€.
  6. μ–Έμ–΄μ˜ λ―Έλ¬˜ν•œ 차이 νŒŒμ•…: λ™μŒμ΄μ˜μ–΄μ™€ 같이 같은 단어가 λ‹€λ₯Έ λ§₯λ½μ—μ„œ λ‹€λ₯Έ 의미λ₯Ό κ°€μ§ˆ λ•Œ, BERTλŠ” ν•΄λ‹Ή λ‹¨μ–΄μ˜ 의미λ₯Ό λ§₯락에 따라 μ •ν™•νžˆ νŒŒμ•…ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μΆ”ν›„ μœ μ €μ˜ μ§€μ†μ μœΌλ‘œ μ—…λ°μ΄νŠΈλœ 포트폴리였 데이터, μΆ”μ²œλœ 곡고 μ€‘μ—μ„œ 관심 μ—†μŒμœΌλ‘œ λΆ„λ₯˜λœ 데이터, 관심 곡고둜 λΆ„λ₯˜λœ 데이터 λ“±μ˜ μΆ”κ°€ ν•™μŠ΅μ„ ν†΅ν•œ νŒŒλΌλ―Έν„° 쑰정에 μš©μ΄ν•˜λ‹€κ³  νŒλ‹¨λ˜μ–΄ μ‚¬μš©ν•˜κ²Œλ˜μ—ˆλ‹€.

Huggingface Transformersμ—μ„œ λ°°ν¬λ˜λŠ” pre-trained λͺ¨λΈμΈ jjzha/jobspanbert-base-cased을 ν™œμš©ν•˜μ—¬ μ±„μš©μ˜ κ΄€μ μ—μ„œ 보닀 fitν•œ 토큰화 및 μž„λ² λ”©μ„ ν•˜κ³ μžν•˜μ˜€λ‹€

λͺ¨λΈμ— κ΄€ν•œ μ°Έκ³  μ‚¬μ΄νŠΈ https://huggingface.co/jjzha/jobspanbert-base-cased/blob/main/README.md

곡고에 ν¬ν•¨λœ μ§€μ›μžκ²©, μš°λŒ€μ‚¬ν•­, μΉ΄ν…Œκ³ λ¦¬μ— λŒ€ν•œ κ°€μ€‘μΉ˜λ₯Ό λ‹€λ₯΄κ²Œ μ£Όμ–΄ μœ μ˜λ―Έν•œ μœ μ‚¬λ„λ₯Ό κ²€μΆœν•˜μ˜€μ§€λ§Œ μœ μ €μ˜ 관심/κ΄€μ‹¬μ—†μŒμœΌλ‘œ 라벨링된 데이터λ₯Ό μƒμ„±ν•˜μ§€ λͺ»ν•˜κΈ°μ— μΆ”ν›„ 지속적인 ν•™μŠ΅μ΄ ν•„μš”ν•˜λ‹€.

μΆ•μ λœ 데이터λ₯Ό λ°”νƒ•μœΌλ‘œ κ³΅κ³ κ°„μ˜ μœ μ‚¬λ„ 뢄석, μœ μ €μ˜ 관심사와 곡고의 μœ μ‚¬λ„ 뢄석을 톡해 μΆ”μ²œ μ„œλΉ„μŠ€ λͺ¨λΈμ˜ 고도화λ₯Ό μ§„ν–‰ν•  κ³„νšμ΄λ‹€.

Releases

No releases published

Packages

No packages published