책 이미지
![[큰글자책] AI와 화학 물질](/img_thumb2/9791128866586.jpg)
책 정보
· 분류 : 국내도서 > 컴퓨터/모바일 > 인공지능
· ISBN : 9791128866586
· 쪽수 : 135쪽
· 출판일 : 2024-08-28
책 소개
목차
우리의 삶과 화학 물질
01 화학 물질과 AI의 만남
02 화학 물질 데이터베이스
03 화학 물질 분야 AI 모델 개발
04 화학 물질 분야 AI 모델 검증
05 화학 물질 개발을 위한 AI 활용법
06 화학 물질 분야 AI 활용 사례
07 동물 시험 대체를 위한 AI
08 화학 물질 분야 AI 활용 난제
09 화학 물질을 위한 AI와 지속 가능성
10 화학 물질 분야 AI 전망
저자소개
책속에서
전문가 시스템을 기반으로 하는 QSAR 모델도 상당수 사용되고 있다. 화학 물질에서 독성을 유발하는 특정 구조 패턴(structural pattern)이 있다는 것을 전문가들이 밝혀내고 정리해 두었는데, 이러한 정보를 바탕으로 독성을 나타낼 수 있는 화학 물질을 찾아내는 방식으로 작동한다. 전문가들이 찾아 놓은 규칙(rule)에 따라서 예측하기 때문에 이를 규칙 기반 모델(rule-based model)이라고도 칭한다. 전문가 시스템이 독성 예측 분야에서 계속 주목받고 활용되는 이유는 예측 결과 해석의 명확성 때문이다. 화학 물질이 독성을 나타내는 명확한 이유를 확인할 수 있기 때문이다.
-01_“화학 물질과 AI의 만남” 중에서
기계 학습 모델을 훈련한 후에는 반드시 검증해야 한다. 검증 데이터에서 좋은 예측력을 보여야 훈련이 제대로 되었다고 평가할 수 있다. 모델의 정확도를 평가하려면 보통은 수집한 데이터를 훈련 데이터(training set), 검증 데이터(validation set), 외부 테스트 데이터(external test set)로 구분한다. 데이터가 어느 정도(1,000개 이상인데 절대적인 기준은 아니다) 있다면 6:2:2 정도 비율로 나눈다(여기서도 제시한 비율은 절대적인 값은 아니다. 훈련 데이터가 부족하면 8:1:1로 나눠도 괜찮다). 훈련 데이터는 모델의 파라미터를 찾아내려고 사용하며, 검증 데이터는 좋은 모델 파라미터를 선정하려고 사용한다. 마지막으로 외부 테스트 데이터를 이용해서 모델의 예측력을 최종 점검한다.
-04_“화학 물질 분야 AI 모델 검증” 중에서
최근 AI 분야에서의 화두는 생성 AI다. 챗GPT도 생성 AI에 속하며, 이미지를 생성하는 달리(DALL-E) 역시 생성 AI다. 달리에서 이미지를 생성하는 딥러닝 모델을 확산(diffusion) 모델이라고 한다. 확산 과정은 물질이 높은 농도에서 낮은 농도로 이동하는 과정인데, 확산 모델에서는 원본 데이터에 조금씩 노이즈(noise)를 추가한 후 다시 노이즈를 점진적으로 제거해서 원본 데이터를 복원하는 과정을 학습한다. 이러한 기술을 화학 물질의 생성에 적용한 연구가 있는데, 신규 스마일스 코드를 만들어 내는 확산 모델을 적용해서 기존에 찾아내지 못했던 새로운 분자 구조를 찾아내는 데에 적용하고 있다. 특히 물질의 3D 구조를 설계하는 데도 활용되고 있는데, 표적 단백질에 약물이 결합하는 부위 내에서 분자 구조를 생성함으로써 효율적으로 신규 약물 구조를 찾아내는 데에 활용된다.
-06_“화학 물질 분야 AI 활용 사례” 중에서