Claude Code vs. Codex

Yayınlanma tarihi 2026-01-13
7 gün içinde güncellendi Lisans CC BY-NC-SA 4.0 artificial intelligencecomputer sciencewritingpersonal

Bu noktaya kadar bir yılı aşkın süredir kodla ilgili hiçbir şeye dokunmamıştım. O zamanlar günlük araçlarım Sonnet 3.7/3.5 ile eşleştirilmiş Cursor'dı. Bu yüzden firmam için bir CRM inşa etmeye başladığımda, bana sunulan tüm yeni oyuncaklarla oynamak için sabırsızlanıyordum. Opus 4.5 çıkmıştı ve herkes ne kadar iyi olduğundan bahsediyordu.

20$ ödeyip Cursor'da bir pro plan satın aldım. Geçmişte agent modunu nadiren kullanıyordum ve her zaman ask moduna bağlı kalıyordum çünkü agent modu genellikle kod tabanımı bozuyor ve istediğim sonuca ulaşmak için birkaç temizlik turu ve manuel düzenleme gerektiriyordu. Aynı şekilde davrandım ve çoğunlukla ask moduna bağlı kaldım ama Cursor, kodu inceledikten sonra değişiklikleri uygulayabilmesi için sürekli agent moduna geçmemi istiyordu. Böylece, yavaş yavaş agent modunu kullanmaya başladım.

Opus 4.5 kullanarak başladım ve sonuçlardan çok memnundum. Opus hızlı ve çalışkan bir şekilde işini yapıyordu; ancak 1.5 gün sonra kullanımıma baktığımda çenem düştü. Aylık kullanım hakkımın %50'sinden fazlasını tüketmiştim. Bu hızda Opus 4.5'i Cursor'da günlük kullanmam imkansızdı. Bu yüzden ertesi gün Sonnet 4.5'e geçtim. İşte burada işler bozulmaya başladı ve model sürekli hata yapıyor veya talimatlarımı görmezden geliyordu. Ne kadar uğraşsam da 3. günde aylık kullanımımı tükettim ve daha fazla kullanmak isteseydim ödeme yapmam gerekiyordu. Composer-1'i (Cursor'ın kendi kodlama modeli) denedim ama çok eskiydi. Sayısız hata yaptı ve beni akıştan çıkardı. Composer-1 kullanırken yaptığım tüm değişiklikleri geri aldım. Opus 4.5'in yeteneklerini tatmıştım ve artık geri dönemezdim.

https://x.com/cursor_ai/status/1999147953609736464

Cursor'da kullanmaktan gerçekten keyif aldığım bir şey, 25 Aralık'ın 11'inde tanıttıkları görsel editördü. Web sitenizdeki bir bileşene tıklayıp doğrudan ona başvurabilir, rengini, konumunu veya boyutunu değiştirebilirdiniz. (Yukarıdaki tam demoyu görebilirsiniz.) Bu, web sitesindeki küçük şeyleri düzenlemeyi kusursuz hale getirdi. Belirli bir düğmenin nerede olduğunu bulmak için yüzlerce/binlerce satır kodu gözden geçirmeniz veya bahsettiğiniz düğmeyi bulmak için LLM'yi kötü bir şekilde yönlendirmeniz gerekmiyordu. Bileşene doğrudan başvurup LLM'ye değişiklikler için talimat verebilirdiniz.

O sırada, Windsurf (Devin tarafından satın alındı) yeni modeli SWE-1.5 ile çıktı. Model Windsurf'te ücretsiz kullanılabiliyordu, ben de denemek için fırsata atladım. Bir gün onunla çalıştım ve Opus 4.5 tarafından şımartıldığım için standartlarıma uymadığı sonucuna vardım. Sonnet 4.5 bile susuzluğumu gideremiyordu, bu yüzden SWE-1.5'in standartlarımı karşılamaması sürpriz olmadı. O gün Windsurf'ü kaldırdım çünkü bana o noktada hiçbir değer sağlamıyordu.

Zaten bir Claude aboneliğim vardı ve Claude Code'u duymuştum ama denememiştim. Bu yüzden, neden olmasın dedim ve terminalimi açıp Claude Code CLI'ı kurdum. Claude Code'da yine Opus 4.5 kullandım ama birebir aynı modeli kullanmama rağmen Cursor'dan farklı bir şey hissettim. Claude Code'un talimatlarımı çok daha iyi anladığı ve istediğim sonuçları verdiği hissine kapıldım. Bir CLAUDE.md yazdım ve CRM'in nasıl görünmesini ve hissettirmesini istediğimi, istediğim özellikleri ve güvenlik gereksinimlerini belirttim. Kullanıcı deneyimi oldukça keyifliydi - düşünürken söylediği küçük anlamsız kelimelerden, bana ipuçları ve dahili COT'unu göstermesine, renk seçimlerine kadar her şey çok hoştu.

Claude Code bana net bir yapılacaklar listesi ve üzerinde çalıştığı şeyleri gösteriyordu, ayrıca mevcut kodumu nasıl değiştirdiğine dair tüm farkları da gösteriyordu. Beni en çok etkileyen şey model değildi - Cursor'da kullandığım aynı Opus 4.5'ti. Claude Code'un modelle nasıl konuştuğuydu. Başka bir deyişle, altındaki modeli yönlendiren harness. Şeffaflık da yardımcı oldu. Bir yapılacaklar listesini tamamlamasını izlemek, çalışırken yüzeye çıkan düşünce parçalarını görmek, çıktıya daha fazla güvenmemi sağladı.

Ara sıra ona yürütmesi için bir talimat listesi veriyordum ve o bir yapılacaklar listesi oluşturuyordu. Yapılacaklar listesini adım adım işleyip sonra bana tüm talimatlarımı uyguladığını söylüyordu ama açıkça yalan söylüyordu. Bir görevi uygulamayı unutuyor ve bana zaten yaptığını söylüyordu ama açıkça yapmamıştı. Kusurları fark etmeye başladım. Ayrıca 5 saatlik hız limitimi 2-3 promptta tükettiğimi ve sıfırlanmasını beklemem gerektiğini fark ettim. Noel tatillerinde tüm büyük yapay zeka laboratuvarları 2x hız limiti verdi ki bu benim için harikaydı ama tatillerden sonra tekrar beklemeye ve terminale bakmaya döndüm.

Bu arada hız limitlerini beklerken, sevgili Opus 4.5'ime sahip olan Antigravity'yi (Cursor'a rakip Google'ın IDE'si) indirdim. Çalışmama devam ettim ve Antigravity'de de oldukça hızlı bir şekilde hız limitlerine takıldım. Cursor kadar iyi olmasa da ücretsizdi ve piyasadaki en iyi modelleri sunuyordu (GPT-5.2 hariç). Gemini 3 Pro'yu kod tabanımda denedim ve anında her şeyi bozdu. Birkaç prompttan sonra Gemini'nin akıl sağlığı için endişelenmeye başladım. Akıl bozukluğu olan kilitli bir savaş esiri gibiydi. Antigravity'yi kapattım, Gemini'yi kitaplığa geri koydum ve geceyi bitirdim. Bir daha asla.

Bu arada hız limitlerimi Opus kadar hızlı tüketmemek için Claude Code'u Sonnet 4.5 ile eşleştirmeyi denedim ama boşunaydı. Sonnet'e prompt veriyordum ve istediğim değişiklikleri yapıyordu, sonra yaptıklarını/bozduklarını düzeltmek için 2-3 kez daha prompt vermem gerekiyordu, yani baştan Opus kullansam aynı miktarda token kullanıyordum. Bu deneyimden sonra Opus'a döndüm çünkü tüm yollar aynı sonuca çıkıyordu.

GPT-5.2 ile eşleştirilmiş Codex'i denemek istedim çünkü zor problemleri ele almada daha iyi olduğunu duymuştum. Bu yüzden, yapay zeka imparatorunun web sitesini açtım ve Codex'i kullanma fırsatı için 20$'ımı ödedim. Bu noktada, Opus 4.5'e Claude Code üzerinden uzun talimatlar vermekte tereddütlüydüm çünkü bazı talimatlarımı uygulamayacağını biliyordum, bu yüzden promptlarımı kısa ve öz tuttum.

İlk bakışta, Codex Claude Code'dan çok daha çirkin. Eğlence yok, renkli kelime oyunları yok, sadece saf iş. Ayrıca promptlarınızda çok daha spesifik olmanız gerekiyor, söylediklerinizi ilk denemede Claude Code kadar iyi anlamıyor. Ayrıca Claude Code kadar iyi bir harness'a sahip değil ama kesinlikle bir iş makinesi. Daha iyi ve daha temiz kod yazıyor. Bu, Opus 4.5'in kodunun kötü olduğu anlamına gelmiyor ama GPT-5.2 biraz daha öne çıkıyor; ancak Opus ve Claude Code'a göre en büyük gelişme güvenilirlik. Talimatlarınızı Opus kadar unutmuyor ve bu güvenilirlik benim için çok önemli bir şey. OpenAI ayrıca hız limitleri konusunda Anthropic'e kıyasla çok daha cömert. Claude Code kullanırken anında hız limitine takılmak yerine Codex ile gerçekten makul miktarda iş yapabileceğimi hissediyorum. (Anthropic ve OpenAI, benim gibi kullanıcılara 20'lık planda OpenAI'ın Anthropic'ten 4-5 kat daha fazla kullanım verdiğini söyleyebilirim. Opus ayrıca daha ayrıntılı, bu yüzden GPT-5.2'nin söylediği aynı şeyi söylemek için daha fazla token harcıyor. Uzun formatlı yazıdan bahsediyorsak Opus 4.5 daha iyi bir model.

Yukarıda listelenen nedenlerden dolayı, farklı kullanımlar için hem Claude Code hem de Codex'in bir kombinasyonunu kullanıyorum. Kod tabanını yeniden düzenliyorsam veya tüm web sayfalarını ve UI bileşenlerini İngilizce'den Türkçe'ye çevirmek gibi uzun bir talimat uyguluyorsam Codex kullanıyorum. Frontend tasarlıyorsam ve UI ile uğraşıyorsam frontend-design eklentisi ile Claude Code kullanıyorum. Claude Code daha iyi bir kullanıcı deneyimi ve çok turlu konuşma sunarken, Codex zor problemlerde ve güvenilirlikte çok iyi. Her iki araç da hala talimatları uygulamayı unutuyor ve yetenekler açısından gidecek uzun bir yolları var. Bir yılda yaşanan ilerleme akıl almaz. Her zaman olduğu gibi, tekrarlamak gerekirse bu modellerin en kötü halleri. Yıllar geçtikçe daha ucuz, daha hızlı, daha zeki ve daha yetenekli olacaklar.

Bu yazıyı Claude Code veya Codex'i nasıl kullanıp üretkenliğinizi 100 katına çıkaracağınız hakkında yazmadım. Sadece bu modellerden/araçlardan bir yılı aşkın süredir uzak olduğum için yeni modelleri ve yeni CLI araçlarını kullanma konusundaki kişisel deneyimlerimi yazmak istedim. Claude Code'un neler yapabileceği hakkında derinlemesine bir rehber isterseniz, Sankalp'in yüzeyin altını kazırsanız nelerin mevcut olduğunu ayrıntılı olarak anlatan iki harika makalesi var. (Skills, plugins, sub-agents, compaction, MCP, hooks vb.)

https://sankalp.bearblog.dev/my-claude-code-experience-after-2-weeks-of-usage/

https://sankalp.bearblog.dev/my-experience-with-claude-code-20-and-how-to-get-better-at-using-coding-agents/

Unutmayın, bunların hepsi benim kişisel deneyimlerim. Sizin deneyiminiz benimkinden farklı olabilir ve bu tamamen normal.

Kesilen kısımlar: Daha önce Warp terminali kullanıyordum, harikadı çünkü yerleşik yapay zeka özellikleri vardı ve terminal komutlarını otomatik olarak çalıştırıyordu. Uzun süre kullandıktan sonra ne kadar enerji tüketen bir uygulama olduğunu fark ettim. O zamandan beri Ghostty'ye geçtim ve Warp'ta bir mühendisle konuştum. Enerji kullanımının öncelik listelerinde olduğunu söyledi, bu yüzden gelecekte tekrar değerlendirebilirim. Ayrıca Mistral'in altında Devstral 2 kullanan CLI aracı Vibes'ı denedim ama dürüst olmak gerekirse adil bir değerlendirme yapacak kadar kullanmadım.