전체 글
-
Phone / Phoneme / Allophone등등 2024. 11. 14. 23:51
Phone (음성)A unit of speech soundE.g. [A]Phoneme (음소)The smallest contrastive unit of language that may change the meaningE.g. /a/Allophone (이음)Variations of phonemes E.g. [pʰ] (as in pin) and [p] (as in spin) are allophones of the phoneme /p/Grapheme (문자소)The smallest contrastive unit in a written languageE.g. help -> h/e/l/pReferenceshttps://linguistics.stackexchange.com/questions/33564/eli5-ph..
-
[취업] 자기소개서 잘 쓰는 법등등 2022. 1. 18. 21:36
https://www.youtube.com/watch?v=eGv5EAMF8OQ&ab_channel=%EB%A9%B4%EC%A0%91%EC%99%95%EC%9D%B4%ED%98%95 1. 상대가 듣고 싶은 말을 작성할 것. (내가 하고 싶은 말이 아니라) 경험의 결과, 어떻게 결과를 얻었나. 두괄식. 결과 중심적. 2. 열정과 경험을 단어가 아닌 숫자로 강조할 것. 열심 열정 노력 같은 단어가 아닌 (이런거는 면접에서). 철저히 결과 중심적으로 자소서를 작성할 것. 3. why라는 질문을 5번 이상 질문한 후 작성한다. 사소한 정보까지 다 주지 마라 면접관은 결과, 결과를 얻기 위한 핵심 행동만을 원한다. 불필요한 정보 빼라! 면접관이 알고 싶은 내용을 작성할 것. 면접관의 관점에서 대답을 할 것!
-
[Python library] timmPython 2022. 1. 18. 12:26
PyTorch Image Models (TIMM) 의 약자로, Image model, layer, utilities, optimizers, schedulers, data-loaders, augmentations, reference training, validation scripts 등등의 collection library라고 한다. 각종 source는 github 및 arxiv paper로 link가 표시되어있다. 각 Model들은 아래의 링크에 정리가 되어있다. 또한 모든 모델들은 pre-trained weight가 제공된다고 한다. (좋은걸?) https://rwightman.github.io/pytorch-image-models/models/
-
[Python] 객체, 클래스Python 2022. 1. 10. 16:35
객체 (object, instance) 어떤 작업을 수행하는 프로그램을 구성하는 구성 요소에는 데이터 1,2,... 데이터를 조작하는 행위 == 함수 가 있다. 객체는 데이터와 함수를 하나의 집합에 모아놓은 것을 말한다. 데이터: member, attribute 함수: method class Rectangle(object): def __init__(self, h, v): self.h = h self.v = v def area(self): return self.h * self.v r = Rectangle(10, 20) a = r.area() print(a) r이 바로 객체를 나타낸다. 속성을 꺼내려면 객체 이름 뒤에 (.)을 붙이면 된다. r.h r.v r.area 클래스 (class) 위 예제에서 Rec..
-
A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement (CRN)AI 모델 2021. 1. 28. 14:56
This text is study for https://web.cse.ohio-state.edu/~wang.77/papers/Tan-Wang1.interspeech18.pdf Overview Propose a new convolutional recurrent network (CRN) to address real-time monoaural speech enhancement Incorporate a convolutional network and LSTM for speech enhancement Show better result than LSTM based model using smaller parameters
-
Anomaly Detection Based on Feature Reconstruction from Sub-sampled Audio SignalsAI 모델 2021. 1. 18. 11:39
This text is study for ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8553480 Overview Propose a feature reconstruction method for anomaly detecrion from the subsampled audio signals Reduce the cost of sound monitoring Propose model TIFO, which is based on LSTM Receive the subsampled time-domain signal Reconstruct the feature vector of the original signal Structure Consist of two parts Sub-sys..
-
Robust Unsupervised Video Anomaly Detection by Multi-Path Frame PredictionAI 모델 2021. 1. 12. 14:07
This text is study for arxiv.org/pdf/2011.02763 Overview Propose unsupervised video anomaly detection, ROADMAP, which usis multi-path ConvGRU Handle informative parts of different scales Catch temporal relationship between frames Introduce a noise tolerance loss Mitigate the inference caused by noise Methodology Overview Consists of Prediction network f Given P consecutive frames , predict next ..
-
Attentive Statistics Pooling for Deep Speaker EmbeddingAI 모델 2021. 1. 11. 16:39
Overview Speaker recognition should be able to get embedding that has Small intra-speaker and Large inter-speaker distance Evaluate most popular loss functions for speaker recognition on the VoxCeleb dataset Propose new metric learning objective function Higher-order pooling with attention Statistics pooling Calculate mean vector [1] Calculate standared deviation vector over frame-level features..