미래내일 일경험 인턴 기록10
Intro
이 글은 미래내일 일경험 인턴십에서 근무하면서
겪거나 배우고 느낀 것을 기록하고자 작성한 포스트입니다.
그 동안 있었던 일
인턴 분 한 분이 나가고 하루 이틀 동안은 분위기가 그리 좋지는 않았던 것 같다.
대표님은 상황을 빨리 정리하고 싶으셨던 것 같은데,
인턴들 사이의 심란한(?) 감정은 있었던 것 같다.
업무적으로는 그동안 공공데이터 포털에 있던 건강검진 관련 빅데이터를 분석했다.
대표님께서는 센터 자체에 있는 데이터의 모수가 너무 적어서 변수들 간의 상관관계가 잘 드러나지 않는다고 생각하셨는지
우리에게 공공데이터 포털에 있는 데이터 분석을 맡기셨다.
근데 우리가 자체적으로 코드를 만들어서 분석을 하기 보다는 지피티를 써서 분석하기를 원하셨다.
https://www.gpters.org/c/data-science/seaborn
위 링크에 나와있는 지피터스라는 사이트에 있는 글을 바탕으로, 흐름을 그대로 따라가면서 분석을 해보라고 하셨는데,
대표님이 지시하신 따른 업무를 완료하고 이것도 했어야 했는데, 깜빡해서 지적을 받았다.
이거 때문에 지피티 유료버전도 결제했다. (나름 이유 부여를 한 건 아니지만, 내 나름대로 쓰고 싶었던 이유가 있었기 때문에 결제를 한 것 같다.)
아무튼, 위 링크에 나온 프로세스처럼 분석을 해봤는데, 왜 컬럼을 멋대로 삭제하냐고 말씀하시면서 다시 분석을 하라고 말씀하셨다.
나름대로 분석을 해봤는데, 어떤 인사이트 나왔는지는 잘 기억이 나진 않는다.
이것 말고도 기존에 프로펫으로 진행했던 부분에 대해서 lstm으로 다시 진행을 해보라고 말씀하신게 기억이 난다.
근데 lstm에 대해서 잘 모르는 상태였기 때문에, 지피티의 힘을 빌릴 수밖에 없었다.
찾아보니 lstm이 여러 계층으로 이루어져 있다는 것을 알 수 있었다. (lstm에 대한 글은 나중에 정리 해볼려고 한다.)
근데 lstm 관련해서 모델 정확도가 낮은 이슈가 있어서 데이터 증강도 해보고 등등… 여러 시도를 해봤는데
낮은 수치의 결과물이 나와서 대표님께 말씀드렸더니 해당 모델이 적합한 게 아니었던 것 같다고 말씀하시면서 다시 프로펫으로
데이터를 돌리면서 시각화를 진행하게 되었다.
이번주에는 장표를 제작 중인데, 어떤 발표에서 사용할 것이라 말씀 하셨다. 구체적인 사항에 대해서는 전해들은 바가 없어서 잘 모름..
그래서 오늘도 장표 관련해서 바이올린 차트를 수정하고, 지피티에게 물어보고 등등의 일을 반복했던 것 같다.
오늘 나름의 이슈
오늘 인턴 한 분이 중도 포기 한 것과 관련해서 미래내일 일경험 센터에서 실사를 나오게 되었다.
그래서 담당 직원분과 면담을 진행했고, 나름 잘 정리가 된 것 같다.
구체적인 답변 과정이나 상황이 잘 기억이 나지 않지만, 상황이 잘 마무리 되었으면 좋겠다.