Intro
- 생성한 이미지 모델이 Test accuracy가 제법 만족스럽게(90% 이상) 나오기도 했고, 2021 서울특별시 빅데이터캠퍼스 공모전의 신청 날짜가 9월30일까지였기에 모델 연구는 조금 나중으로 미루고 프로젝트 완성 각을 재보기로 했다.
모델과 Django의 결합
-
완성된 모델을 landmark_image_recognition 프로젝트로 복사한 후, 모델을 불러와 predict를 수행했다.
-
프론트 엔드 설계와 달리, 예측 정확도는 따로 낼수 없었다.
- 설계할때 evaluate와 predict를 헷갈려서 발생한 일이었다.
- test label이 존재하는 evaluate와 달리, predict는 예측 정확도를 뽑을 수 없다.
- 엄밀히 말하자면, multi-classes 문제라면 예측 결과가 확률로 나올수 있을것 같지만 모델 제작 당시 그러한 가능성을 제외하고 만들었으므로(63빌딩이면서 동시에 이순신 장군 동상일수는 없지 않은가) 내가 제작한 모델에서는 나올수 없는것 같았다.
챌린지 결과
- 프로젝트 6일차에 명명한 챌린지에 대한 실험 결과는 다음과 같았다.
- 실험에 사용한 테스트 데이터는 모두 훈련데이터에 없는 데이터들을 사용했다.
- 파크원 챌린지의 경우, 데이터셋 수집 당시의 생각과 다르게 3채널, rgb를 모두 모델에 포함시켜 훈련시켰으므로 의미가 사라졌다.
챌린지 내용 확인
남산골한옥마을 챌린지
* 남산타워 + 한옥 이라는 조합으로 해당 위치라는것을 인식할수 있을까?
* Test Case 01. 실패(광화문)
* Test Case 02. 성공
* Test Case 03. 성공
* Test Case 04. 실패(북촌한옥마을)
* Test Case 05. 성공
* 평가 : 남산타워+한옥의 조합이 남산골 한옥마을인것을 정확히 캐치했지만, 반작용으로 일반적인 한옥에 대한 인식은 실패하는 모습을 보인다.
목동종합운동장 챌린지
* 지근거리에 있는 세개의 장소에 대해 두장소 이상이 동시에 찍힌 사진의 경우 의도적으로 배제하지 않음.
* 아이스링크
* Test Case 01. 성공
* Test Case 02. 실패(서울특별시청)
* Test Case 03. 성공
* 야구장
* Test Case 01. 성공
* Test Case 02. 실패(63빌딩)
* Test Case 03. 성공
* 주경기장
* Test Case 01. 실패(서울무역전시컨벤션센터)
* Test Case 02. 실패(서울특별시청)
* Test Case 03. 실패(남산서울타워)
* 평가 : 주경기장의 경우, 중복데이터를 제외하면 거의 남는 사진이 없다시피해서 모조리 실패한듯한 모양이다. 그냥 종합운동장 하나로 세 데이터를 묶어서 학습시키는것이 나을것 같다.
서울숲 챌린지
* 특징적인 지표가 존재하지 않는 장소에 대해 정제하지 않은 데이터로 학습시켰을때 인식할수 있을까?
* Test Case 01. 성공
* Test Case 02. 성공
* Test Case 03. 성공
* Test Case 04. 실패(암사동 선사유적지)
* Test Case 05. 성공
* 평가 : 숲이라 부를만한 데이터가 서울숲 한곳뿐이라 그런건지, 아니면 진짜 데이터 정제가 없어도 양으로 밀어붙이면 되는건지는 몰라도 상당히 높은 성공률을 기록했다.
* 누락시켰었던 '양재시민의숲' 데이터를 넣고 한번 더 모델을 훈련시켜 실험해볼 필요가 있을것같다.
결과