Forum

Bildirimler
Hepsini Temizle

Cluster içi farklı cpu değerleri

Sayfa 1 / 2
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Merhaba,

Var olan cluster yapımızda, bazı prod makinalarımızda yük problemi oluşmaya başladı.

Tamamen aynı zamanda alınan ve tüm Cpu & Memory değerleri aynı olan sunucularda X makinası A hostunda %20 cpu kullanırken B hostunda %5 kullanmakta.

Denemek için problemli hostun üzerindeki tüm vmleri tamamen boşaltıp, tek başına makinayı alıyorum, cpu ortalama %20 değerlere vuruyor.

Sonra üzerinde 15 vm olan, fiziksel olarak CPU'su %40 larda olan hyperv sunucuma alıyorum, direkt %5 e düşüyor.

Network ya da Fiber tarafında bir yoğunluk mu var diye test ediyorum, ama boş sunucu olunca o kadar bir yük getirmiyor.

San Switch tarafında CRC değerlerinide kontrol ettim. Herhangi bir alarm gelmiyor.

En son problemli olan sunucuyu SPP leri kurdum. ( Gen 8 Sunucu , SPP 8.1 ) Fakat bu sabah geldiğimde gen aynı durum ile karşılaştım.

Böyle bir problem başına gelen oldu mu?

ÇözümPark

Alıntı
Konu başlatıcı Gönderildi : 14/05/2018 12:17
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Merhaba,

ilgili sorunlu sanal makineye PAL kurup gerçekten CPU tüketen neymiş kontrol eder misin?

Yani A hostunda sanal makine iki gün çalışsın PAL raporunu al.

Sonra B hostuna taşı orada da iki gün çalışsın PAL raporuna bak

eğer CPU değerleri aynı ise sorun host bazlıdır.

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 14/05/2018 13:43
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Deniyor olacağım.

Host bazlıdan kasıt nedir?

HP tarafına bir problem var demek için, bir kanıt aradım fakat SPP Long Test te herhangi bir şey bulamadım. Makina güllük gülistanlık gibi gözüküyor.

Bu arada, aşağıdaki link dangerous veriyor chrome da.Aynı dosyadan bahsediyoruz değil mi?

https://archive.codeplex.com/?p=pal

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 14/05/2018 13:59
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Evet link doğru sorun yok temiz bir program 🙂

http://tv.cozumpark.com/video/155/Performance-Analysis-of-Logs-PAL-Tool-Kullanimi

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 14/05/2018 15:30
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

🙂

Yalnız ben CPU'nun ne kullandığını biliyorum.

w3wp.exe kullanıyor. Sorun, A hostuna taşıyınca sanal makinayı niye CPU %20 civarında çalışıyorken, B sunucusuna taşıyınca %5 kullanıyor.

Network kartı yetiyor mu yetmiyor mu testini yaptım,

Aynı özelliklerde farklı bir hosta taşıyınca sorun yaşamadığını gördüm.

Farklı özelliklerde farklı bir hosta taşıyınca sorun yaşamadığını gördüm.

Arızalı olduğunu düşündüğüm sunucuyu SPP yaptım, ( Diğerlerinde hepsinde update durumu aynı seviyede )

 

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 14/05/2018 20:22
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Benim cevabımı bir daha okursan PAL ı CPU tüketim kaynağı için kullanmadığımı anlarsın 🙂

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 14/05/2018 20:46
Ferhat Indi
(@FerhatIndi)
Üye

Sanki bir microsoft  BUG gibi duruyor. cluster validation yaptinizmi?

CevapAlıntı
Gönderildi : 15/05/2018 08:16
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Yaptım evet, ama elle tutulur bir şey vermiyor. herşey validate.

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 16/05/2018 14:08
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

PAL sonucuna daha var değil mi?

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 16/05/2018 16:50
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

PAL tarafında şöyle bir değer çıktı.

Etki direkt olduğu için pal'ı hemen görebiliyorum.

Hyperv06 üzerindeki alarmlar / bunlar hyperv01 ya da 02 ya da 03 nolu sunucuya alınca gelmiyor. 

Ama hyperv05 üzerine ya da 06 üzerine alırsam geliyor.

 

https://ibb.co/f0WD6J

Acaba disk okuma sürelerinde mi birşey var diye benchmark testi yaptığımda,

Hyperv01 in disk okuma süreleri;

https://ibb.co/nCrrty

Hyperv06 ın disk okuma süreleri;

https://ibb.co/fVqUfd

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 16/05/2018 18:14
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Aynı testleri, fiziksel sunucuda yaptım.

Disk tarafında bu sefer bir problem vermedi, ama sanal makinada gene problem veriyor.

Hyper-V kaynaklı bir problem gibi.

Bunla ilgili bir update ben göremedim, bakabileceğim kaynak var mı?

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 17/05/2018 13:58
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Evet güzel tespitler, node üzerinde bir sıkıntı olduğu belli, aşağıdaki komutların çıktılarını alabilir miyim?

Get-StorageQosFlow
Get-StorageQosFlow | Sort-Object StorageNodeIOPs -Descending | ft InitiatorName, @{Expression={$_.InitiatorNodeName.Substring(0,$_.InitiatorNodeName.IndexOf('.'))};Label="InitiatorNodeName"}, StorageNodeIOPs, Status, @{Expression={$_.FilePath.Substring($_.FilePath.LastIndexOf('\')+1)};Label="File"} -AutoSize
kontol edeceğin bir vm
Get-StorageQosFlow -InitiatorName BuildVm1 | Format-List
Get-StorageQosVolume | Format-List
Get-StorageQoSflow | Sort-Object InitiatorName | ft InitiatorName, Status, MinimumIOPs, MaximumIOPs, StorageNodeIOPs, Status, @{Expression={$_.FilePath.Substring($_.FilePath.LastIndexOf('\')+1)};Label="File"} -AutoSize 
disk üzerine atanmış bir policy var mı kontrol için daha fazla komutu burada bulabilirsin
 
 

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 18/05/2018 00:49
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Bu komutlar galiba 2016 için, en azından üstün körü öyle gördüm 🙂 

Bendeki QOS tarafı şu şekilde, bir policy yapılmamış.

https://ibb.co/eahLqd

 

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 18/05/2018 12:15
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Tamam bu durumda geriye bir şey kalıyor ama şimdi aklıma gelmiyor, bir müşteride olmuştu maillere bakıp bilgi vereceğim.

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 18/05/2018 23:48
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Benim fikirlerim tükendi, süper olur valla bulabilirsen

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 19/05/2018 00:05
Yilmaz BARCIN
(@yilmazbarcin)
Saygın Üye

merhaba,

bios ayarlarında cpu ile ilgili parametreleri kontrol ettiniz mi ? 2 fiziksel sunucuda da aynı mı ? 

ben bu tip sorunların bios taki cpu ayarlarının farklı olmasından kaynaklandığına çok şahit oldum...

bios tarafını kontrol etmenizi, bios, bmc vb. donanım firmware upgrade leri varsa öncelikli olarak bunları geçip test etmenizi öneririm.

 

kolay gelsin,

yB

CevapAlıntı
Gönderildi : 19/05/2018 14:31
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Merhbaa,

Tüm ayarları aynı.

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 21/05/2018 14:11
Hakan Uzuner
(@hakanuzuner)
Kıdemli Üye Yönetici

Evet maili buldum 🙂 

Müşterideki sorun ODX sorunu HBA firmware güncellemesi sonrası düzelmiş bir kontrol eder misin?

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 24/05/2018 02:22
Kerem Göktay
(@keremgoktay)
Üye Forum Yöneticisi

Merhaba,

Malesef hba firmware güncelleme ve ODX'i disable / enable etmem bir işe yaramadı.

Şu ana kadar yaptıklarımızı toplayacak olursam,

 

SPP Update (8.1)

HBA Firmware update ( Manuel , spp dışı hp linkinden indirerek. )

Windows Updatei

HyperV üzerinden farklı CPU ile çalışabilme modunun açılıp kapanması

Windows tarafında ODX enable / disable

CRC Kontrolü ( Hem Switch hem de Client üzerinde, 0 olduğu gözükmesi )

ÇözümPark

CevapAlıntı
Konu başlatıcı Gönderildi : 25/05/2018 20:18
Sayfa 1 / 2
Paylaş: