Forum

Bildirimler
Hepsini Temizle

[Çözüldü] Cluster içi farklı cpu değerleri

29 Yazılar
5 Üyeler
0 Likes
1,286 Görüntüleme
(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Merhaba,

Var olan cluster yapımızda, bazı prod makinalarımızda yük problemi oluşmaya başladı.

Tamamen aynı zamanda alınan ve tüm Cpu & Memory değerleri aynı olan sunucularda X makinası A hostunda %20 cpu kullanırken B hostunda %5 kullanmakta.

Denemek için problemli hostun üzerindeki tüm vmleri tamamen boşaltıp, tek başına makinayı alıyorum, cpu ortalama %20 değerlere vuruyor.

Sonra üzerinde 15 vm olan, fiziksel olarak CPU'su %40 larda olan hyperv sunucuma alıyorum, direkt %5 e düşüyor.

Network ya da Fiber tarafında bir yoğunluk mu var diye test ediyorum, ama boş sunucu olunca o kadar bir yük getirmiyor.

San Switch tarafında CRC değerlerinide kontrol ettim. Herhangi bir alarm gelmiyor.

En son problemli olan sunucuyu SPP leri kurdum. ( Gen 8 Sunucu , SPP 8.1 ) Fakat bu sabah geldiğimde gen aynı durum ile karşılaştım.

Böyle bir problem başına gelen oldu mu?

ÇözümPark

 
Gönderildi : 14/05/2018 12:17

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Merhaba,

ilgili sorunlu sanal makineye PAL kurup gerçekten CPU tüketen neymiş kontrol eder misin?

Yani A hostunda sanal makine iki gün çalışsın PAL raporunu al.

Sonra B hostuna taşı orada da iki gün çalışsın PAL raporuna bak

eğer CPU değerleri aynı ise sorun host bazlıdır.

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 14/05/2018 13:43

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Deniyor olacağım.

Host bazlıdan kasıt nedir?

HP tarafına bir problem var demek için, bir kanıt aradım fakat SPP Long Test te herhangi bir şey bulamadım. Makina güllük gülistanlık gibi gözüküyor.

Bu arada, aşağıdaki link dangerous veriyor chrome da.Aynı dosyadan bahsediyoruz değil mi?

https://archive.codeplex.com/?p=pal

ÇözümPark

 
Gönderildi : 14/05/2018 13:59

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Evet link doğru sorun yok temiz bir program 🙂

https://www.youtube.com/watch?v=kf88NH2c-KE

Bu ileti 3 ay önce Hakan Uzuner tarafından düzenlendi

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 14/05/2018 15:30

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

🙂

Yalnız ben CPU'nun ne kullandığını biliyorum.

w3wp.exe kullanıyor. Sorun, A hostuna taşıyınca sanal makinayı niye CPU %20 civarında çalışıyorken, B sunucusuna taşıyınca %5 kullanıyor.

Network kartı yetiyor mu yetmiyor mu testini yaptım,

Aynı özelliklerde farklı bir hosta taşıyınca sorun yaşamadığını gördüm.

Farklı özelliklerde farklı bir hosta taşıyınca sorun yaşamadığını gördüm.

Arızalı olduğunu düşündüğüm sunucuyu SPP yaptım, ( Diğerlerinde hepsinde update durumu aynı seviyede )

 

ÇözümPark

 
Gönderildi : 14/05/2018 20:22

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Benim cevabımı bir daha okursan PAL ı CPU tüketim kaynağı için kullanmadığımı anlarsın 🙂

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 14/05/2018 20:46

(@FerhatIndi)
Gönderiler: 467
Honorable Member
 

Sanki bir microsoft  BUG gibi duruyor. cluster validation yaptinizmi?

 
Gönderildi : 15/05/2018 08:16

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Yaptım evet, ama elle tutulur bir şey vermiyor. herşey validate.

ÇözümPark

 
Gönderildi : 16/05/2018 14:08

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

PAL sonucuna daha var değil mi?

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 16/05/2018 16:50

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

PAL tarafında şöyle bir değer çıktı.

Etki direkt olduğu için pal'ı hemen görebiliyorum.

Hyperv06 üzerindeki alarmlar / bunlar hyperv01 ya da 02 ya da 03 nolu sunucuya alınca gelmiyor. 

Ama hyperv05 üzerine ya da 06 üzerine alırsam geliyor.

 

https://ibb.co/f0WD6J

Acaba disk okuma sürelerinde mi birşey var diye benchmark testi yaptığımda,

Hyperv01 in disk okuma süreleri;

https://ibb.co/nCrrty

Hyperv06 ın disk okuma süreleri;

https://ibb.co/fVqUfd

ÇözümPark

 
Gönderildi : 16/05/2018 18:14

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Aynı testleri, fiziksel sunucuda yaptım.

Disk tarafında bu sefer bir problem vermedi, ama sanal makinada gene problem veriyor.

Hyper-V kaynaklı bir problem gibi.

Bunla ilgili bir update ben göremedim, bakabileceğim kaynak var mı?

ÇözümPark

 
Gönderildi : 17/05/2018 13:58

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Evet güzel tespitler, node üzerinde bir sıkıntı olduğu belli, aşağıdaki komutların çıktılarını alabilir miyim?

Get-StorageQosFlow
Get-StorageQosFlow | Sort-Object StorageNodeIOPs -Descending | ft InitiatorName, @{Expression={$_.InitiatorNodeName.Substring(0,$_.InitiatorNodeName.IndexOf('.'))};Label="InitiatorNodeName"}, StorageNodeIOPs, Status, @{Expression={$_.FilePath.Substring($_.FilePath.LastIndexOf('\')+1)};Label="File"} -AutoSize
kontol edeceğin bir vm
Get-StorageQosFlow -InitiatorName BuildVm1 | Format-List
Get-StorageQosVolume | Format-List
Get-StorageQoSflow | Sort-Object InitiatorName | ft InitiatorName, Status, MinimumIOPs, MaximumIOPs, StorageNodeIOPs, Status, @{Expression={$_.FilePath.Substring($_.FilePath.LastIndexOf('\')+1)};Label="File"} -AutoSize 
disk üzerine atanmış bir policy var mı kontrol için daha fazla komutu burada bulabilirsin
 
 

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 18/05/2018 00:49

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Bu komutlar galiba 2016 için, en azından üstün körü öyle gördüm 🙂 

Bendeki QOS tarafı şu şekilde, bir policy yapılmamış.

https://ibb.co/eahLqd

 

ÇözümPark

 
Gönderildi : 18/05/2018 12:15

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Tamam bu durumda geriye bir şey kalıyor ama şimdi aklıma gelmiyor, bir müşteride olmuştu maillere bakıp bilgi vereceğim.

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 18/05/2018 23:48

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Benim fikirlerim tükendi, süper olur valla bulabilirsen

ÇözümPark

 
Gönderildi : 19/05/2018 00:05

(@yilmazbarcin)
Gönderiler: 315
Illustrious Member
 

merhaba,

bios ayarlarında cpu ile ilgili parametreleri kontrol ettiniz mi ? 2 fiziksel sunucuda da aynı mı ? 

ben bu tip sorunların bios taki cpu ayarlarının farklı olmasından kaynaklandığına çok şahit oldum...

bios tarafını kontrol etmenizi, bios, bmc vb. donanım firmware upgrade leri varsa öncelikli olarak bunları geçip test etmenizi öneririm.

 

kolay gelsin,

yB

 
Gönderildi : 19/05/2018 14:31

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Merhbaa,

Tüm ayarları aynı.

ÇözümPark

 
Gönderildi : 21/05/2018 14:11

Hakan Uzuner
(@hakanuzuner)
Gönderiler: 32981
Illustrious Member Yönetici
 

Evet maili buldum 🙂 

Müşterideki sorun ODX sorunu HBA firmware güncellemesi sonrası düzelmiş bir kontrol eder misin?

Danışman - ITSTACK Bilgi Sistemleri
****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

 
Gönderildi : 24/05/2018 02:22

(@keremgoktay)
Gönderiler: 117
Üye
Konu başlatıcı
 

Merhaba,

Malesef hba firmware güncelleme ve ODX'i disable / enable etmem bir işe yaramadı.

Şu ana kadar yaptıklarımızı toplayacak olursam,

 

SPP Update (8.1)

HBA Firmware update ( Manuel , spp dışı hp linkinden indirerek. )

Windows Updatei

HyperV üzerinden farklı CPU ile çalışabilme modunun açılıp kapanması

Windows tarafında ODX enable / disable

CRC Kontrolü ( Hem Switch hem de Client üzerinde, 0 olduğu gözükmesi )

ÇözümPark

 
Gönderildi : 25/05/2018 20:18

Sayfa 1 / 2
Paylaş: