Keras ile Ortak Kelime Dağarcığı (joint-vocabulary) Oluşturulması

Ortak kelime dağarcığı oluşturulması bir çok NLP problemi için gerekli bir adımdır. Çeviri (machine translation), sınıflandırma, named-entity tespiti gibi farklı çalışmalarda uygulamanın geliştirilmesi sonrasında (production aşamasında) giriş verilerinin eğitim ve test verileriyle aynı şekilde ele alınmasını sağlamak amacıyla ortak kelime Daha fazla oku …

Metin Ön İşleme Adımları İçin Keras Tokenizer Sınıfı Kullanımı

Metin ön işleme (text pre-processing) doğal dil işlemenin çoğu zaman zahmetli fakat  algoritmanın başarısını etkileyen zaruri ön adımlarındandır. Metin verisinin hazırlanma adımlarını gerçekleştirirken kalıplaşmış bazı sorulara cevap verilmesi gerekir: noktalama işaretlerinin arındırılması (cleaning) cümle, kelime, harf veya n-gramlar halinde parçalama Daha fazla oku …

Colab’da TensorBoard Çalıştırma (colab_utils)

Bu yazıda Colab içerisinde geliştirdiğimiz TensorFlow ya da Keras projesinde TensorBoard’u çalıştırmak için bir yöntem anlatılacaktır. Bildiğiniz üzere Colab (colab.research.google.com) derin öğrenme uygulamaları geliştirmek  için bizlere GPU (Nvidia Tesla K80 GPU) hesaplama ortamı sunan, içerisinde bir çok Python ve derin Daha fazla oku …

Veri Seti Hazırlama Araçları

Makine öğrenmesi ve derin öğrenme konularına çalışmaya yeni başlayanlar ilk aşamalarda gelenekselleşmiş bazı problemlerin çözümleri üzerinden konuları öğrenir. Örneğin el yazısıyla yazılmış rakam görüntülerinden oluşan MNIST veri seti kullanılarak el yazısı görüntüsünden rakam tespitinin yapılması ya da Reuters haberlerinin otomatik Daha fazla oku …

API Kavramı ve Twitter API

Bu yazıda API kavramının ne olduğundan ve Twitter API’larında bahsedilmiştir. Veri toplamak için gerekli ilk adımlar gösterilmiştir. Kod örnekleriyle verilerin toplanması adımları sonraki yazıda paylaşılacaktır. Twitter’in resmi API’larını kullanarak ücretsiz olarak veri toplamamız mümkündür. Twitter’in bu amaçla sunduğu 2 adet Daha fazla oku …