fbpx
Anasayfa » Forum

Hp konusunda tavsiy...
 

Hp konusunda tavsiye isteği  

  RSS
Volkan Çelebi
(@VolkanCelebi)
Üye

Merhaba arkadaşlar,

 

yurtdışındaki bir datacenterda 3 adet fiziksel HP Serverim var. Aynı zamanda burada da atıl duurmda bir serverim var. Hepsi aynı model Hp380 Gen7 makineler ve bu 4 server'da zaman zaman reset atıyorlar. Bu süre 1 ila 60 gün arasında. Hepsinde çift çekirdek var ve %70 CPU üstü bir kullanımları yok. 

Artık bu durum o kadar psikolojimi rahatsız etmeye başladı ki monit ten server reset emaili aldığım anda bütün yaşam enerjim gidiyor. Sıcaklık gibi bir problem yok, dediğim gibi datacenterda soğutmalı yerdeler. Power sorunları yok, ILO'dan bakıyorum her şpey muhteşem ama işte bu 4 makinenin restart olayını çözemedim. Her restart ettiğinde bazısındaki DVR kayıtları diğerlerinde bazı servisler duruyor vs.

genelde restart sebebi olarak CPU'lar gözüküyor. Bazen CPU 1 bazen 2 hemen hemen hepsinde aynı şey var. 

 

HP forumlarında bu sorundan müzdarip çok insan var ve zaten tüm makineler tavsiye edilen BIOS ayarları yapıldı. Şimdi ben garantileri çoktan dolmuş bu serverler için ne yapabilirim. HP bunlarla ilgilenir mi? Kime yazsam ne yapsam. Bu arada Yurtdışında oturuyorum.

 

Yeni server alsam HP markasından o kadar soğudum ki anlatamam ama işte şu ILO olayı yüzünden marka da değiştirmek istemiyorum. 

Alıntı
Gönderildi : 09/09/2018 19:32
ozkanburgac
(@ozkanburgac)
Üye

Selam ,

 

Açıkçası hp kullanmam tavsiyede etmem Dell Candır gerisi heyecan 🙂

 

Sunucularının üzerinde koşan sistemlerin event log incelemende fayda var belkide sistemlerde tetikleyen bir durum olabilir 

Sunucuların bu restart durumu kronik mi ? Sürekli aynı veya yakın zamanlardamı ?

İlo ile donanımda bir donanım taraması yapman iyi olur

CevapAlıntı
Gönderildi : 09/09/2018 23:29
Turan COŞKUN
(@turancoskun)
Üye Forum Yöneticisi

merhaba,

yaşadığınız durum gerçekten can sıkıcı.

benzer süreçler her markada var, zamanında dell r730 ve cisco ucs  ile yaşadıklarımız kitap olur.

hp ilk tercihim değil, ancak tüm modelleri ile sorunlu bir markada değil.

üreticinin global tarafına, yaşadıklarınızı detaylı anlatan bir mail gönderin.

tabi destek paketi/garantisi bulunmayan ürünlere hizmet vermiyorum diyebilir.

sorun döneminde kronik ise, ilgili birime yönlendirip, çözüm üretmenizi sağlayabilir.

os seviyesinde kontrollerin sonrasında, sorun direk hp ve cpu tarafında diyorsanız, 4 host'u farklı cpu seçeneklerinde bir dönem çalıştırmayı deneyin.

****************************************************************
Probleminiz Çözüldüğünde Sonucu Burada Paylaşırsanız.
Sizde Aynı Problemi Yaşayanlar İçin Yardım Etmiş Olursunuz.
Eğer sorununuz çözüldü ise lütfen "çözüldü" olarak işaretlerseniz diğer üyeler için çok büyük kolaylık sağlayacaktır.
*****************************************************************

CevapAlıntı
Gönderildi : 10/09/2018 04:36
Erdem Yağlıkara
(@erdemyaglikara)
Üye

Merhaba,

Sıkıntılı bir süreç 4 serverda aynı sorun olması biraz enterasan olmuş güncel bios update yapmayı deneyebildiniz mi? Sunucularda yüklü olan işletim sistemlerinde log kayıtlarını kontrol edebildiniz mi? hp kurumsal destek hattından sunucuyla ilgili kronik bir problem olup olmadığını görüşebilirsiniz.

CevapAlıntı
Gönderildi : 10/09/2018 13:03
Zafer SEN
(@ZaferSEN)
Üye

[quote user="Volkan Çelebi"]

Merhaba arkadaşlar,

 

yurtdışındaki bir datacenterda 3 adet fiziksel HP Serverim var. Aynı zamanda burada da atıl duurmda bir serverim var. Hepsi aynı model Hp380 Gen7 makineler ve bu 4 server'da zaman zaman reset atıyorlar. Bu süre 1 ila 60 gün arasında. Hepsinde çift çekirdek var ve %70 CPU üstü bir kullanımları yok. 

Artık bu durum o kadar psikolojimi rahatsız etmeye başladı ki monit ten server reset emaili aldığım anda bütün yaşam enerjim gidiyor. Sıcaklık gibi bir problem yok, dediğim gibi datacenterda soğutmalı yerdeler. Power sorunları yok, ILO'dan bakıyorum her şpey muhteşem ama işte bu 4 makinenin restart olayını çözemedim. Her restart ettiğinde bazısındaki DVR kayıtları diğerlerinde bazı servisler duruyor vs.

genelde restart sebebi olarak CPU'lar gözüküyor. Bazen CPU 1 bazen 2 hemen hemen hepsinde aynı şey var. 

 

HP forumlarında bu sorundan müzdarip çok insan var ve zaten tüm makineler tavsiye edilen BIOS ayarları yapıldı. Şimdi ben garantileri çoktan dolmuş bu serverler için ne yapabilirim. HP bunlarla ilgilenir mi? Kime yazsam ne yapsam. Bu arada Yurtdışında oturuyorum.

 

Yeni server alsam HP markasından o kadar soğudum ki anlatamam ama işte şu ILO olayı yüzünden marka da değiştirmek istemiyorum. 

[/quote]

merhaba

3'ü yurtdışında biri burada 4 server zaman zaman restart oluyor?

troubleshoot için ilk olarak bu 4 serverin ortak alanlarını bulmanızı öneririm.

hepsi aynı yerde olmadığı için elektrik değil gibi görünüyor.

üzerlerinde nasıl bir uygulama çalışıyor, ortak uygulama var mı?

işletim sistemleri aynı mı? güncel mi?

üzerlerinde Antivirüs veya benzeri bir yazılım var mı? güncel mi?

event loglarda kapanmadan hemen önce ve açıldıktan sonra neler var?

üzerlerinde %70 cpu kullanımı yok demişsiniz ama belirli bir zamanda çalışan bir job olabilir mi?

mesela yedekleme yada update yada av scan gibi, çalışan bir job cpu değerinde değişime yol açan birşey olabilir.

her restart ettiğnde bazısındaki DVR kayıtları diğerlerinde bazı servisler duruyor demişsiniz 

server üzerinde NVR yani video kayıt yazılımı mı var? restart sonrası duruyor dediğiniz servisler neler,bunların kapanmadan önceki event loglarında ne var.

 

HP case açsanız bile donanımla ilgili birşey değil gibi duruyor, bir şekilde belirli bir periyotta oluyorsa zamanlanmış bir job olma ihtimali var bence.

CevapAlıntı
Gönderildi : 10/09/2018 13:09
Volkan Çelebi
(@VolkanCelebi)
Üye

[quote user="Zafer SEN"]

[quote user="Volkan Çelebi"]

Merhaba arkadaşlar,

 

yurtdışındaki bir datacenterda 3 adet fiziksel HP Serverim var. Aynı zamanda burada da atıl duurmda bir serverim var. Hepsi aynı model Hp380 Gen7 makineler ve bu 4 server'da zaman zaman reset atıyorlar. Bu süre 1 ila 60 gün arasında. Hepsinde çift çekirdek var ve %70 CPU üstü bir kullanımları yok. 

Artık bu durum o kadar psikolojimi rahatsız etmeye başladı ki monit ten server reset emaili aldığım anda bütün yaşam enerjim gidiyor. Sıcaklık gibi bir problem yok, dediğim gibi datacenterda soğutmalı yerdeler. Power sorunları yok, ILO'dan bakıyorum her şpey muhteşem ama işte bu 4 makinenin restart olayını çözemedim. Her restart ettiğinde bazısındaki DVR kayıtları diğerlerinde bazı servisler duruyor vs.

genelde restart sebebi olarak CPU'lar gözüküyor. Bazen CPU 1 bazen 2 hemen hemen hepsinde aynı şey var. 

 

HP forumlarında bu sorundan müzdarip çok insan var ve zaten tüm makineler tavsiye edilen BIOS ayarları yapıldı. Şimdi ben garantileri çoktan dolmuş bu serverler için ne yapabilirim. HP bunlarla ilgilenir mi? Kime yazsam ne yapsam. Bu arada Yurtdışında oturuyorum.

 

Yeni server alsam HP markasından o kadar soğudum ki anlatamam ama işte şu ILO olayı yüzünden marka da değiştirmek istemiyorum. 

[/quote]

merhaba

3'ü yurtdışında biri burada 4 server zaman zaman restart oluyor?

troubleshoot için ilk olarak bu 4 serverin ortak alanlarını bulmanızı öneririm.

 

 

hepsi aynı yerde olmadığı için elektrik değil gibi görünüyor.

üzerlerinde nasıl bir uygulama çalışıyor, ortak uygulama var mı?

Ortak alan hepsinde aynı OS var Ubuntu 14.04 Server. 4'ünün de üzerindeki uygulamalar farklı. Dah açok CPU bağımlı transcode işlemleri var. Sıkıntı olmasın diye %70 üstü çok nadir durumlar hariç yüklenmiyorum

işletim sistemleri aynı mı? güncel mi?

üzerlerinde Antivirüs veya benzeri bir yazılım var mı? güncel mi?

yok zira ubuntu çalışıyor x yok

event loglarda kapanmadan hemen önce ve açıldıktan sonra neler var?

ilk mesajdaki gibi CPU bazlı hatalar var. Burada hp forumlarında aynı sorunu yaşayan insanlar var. Hatta DL385 modellerinde bile benzer sorunlar var. Kimilerinde bazı BIOS ayarları ile sorun çözülmüş bende malesef mümkün olmadı

https://community.hpe.com/t5/ProLiant-Servers-ML-DL-SL/DL380G7-Uncorrectable-Machine-Check-Exception/td-p/4766324

üzerlerinde %70 cpu kullanımı yok demişsiniz ama belirli bir zamanda çalışan bir job olabilir mi?

hayır kontrol altında

mesela yedekleme yada update yada av scan gibi, çalışan bir job cpu değerinde değişime yol açan birşey olabilir.

 

her restart ettiğnde bazısındaki DVR kayıtları diğerlerinde bazı servisler duruyor demişsiniz 

server üzerinde NVR yani video kayıt yazılımı mı var? restart sonrası duruyor dediğiniz servisler neler,bunların kapanmadan önceki event loglarında ne var.

bir tanesinde var. 8x hdd var 7*24 kayıt alıyor. Restart ettiğinde süreklilik bozulduğu için çok sorun yaşıyoruz. Her seferinde kontyrol etmek gerekiyor. kayıtları gönderen sistem servere ulaşamadığı için Timeout oluyor ve kayıt mekanizması kapanıyor ve tekjrar enable etmek gerekiyor vs

HP case açsanız bile donanımla ilgili birşey değil gibi duruyor, bir şekilde belirli bir periyotta oluyorsa zamanlanmış bir job olma ihtimali var bence.

[/quote]

 

Lisans olmadığı için BIOS indiremiyorum. Bir tanesi hariç hepsi en son BIOS verisyona sahip. Lazım olan BIOS (2015.08.16) for the DL360 G7 P67

CevapAlıntı
Gönderildi : 10/09/2018 15:43
ibrahim yildiz
(@ibrahimyildiz)
Üye

Bu tip sorunlar temel de 2 nedenden kaynaklanır. Ömür dolayısıyla yıpranan donanımlar sonucu erken taşmalar sonucu crash'ler ve sorunlu yazılımlar kaynaklı işlemci taşmaları. Bunlara Xeon ve ECC 'ler dahi engel olamayabilir. Siz % kullanımı düşük görüyor olsanız dahi CPU TDP 'leri bir şekilde aşıldığı anda OS kilitlenebilir yada sunucu restart olabilir. Verdiğiniz linktekiler de bunları düşündürüyor. Sunucular epey eski nesil geçmişte ağır yük altında çalıştırılmışsa cpu'lar sürekli max TDP değerlerine yakın kalmışsa, VRM'ler yıpranmışsa bu tip çakılmalar görülebilir. Sıklıkla ve tüm yükler altında olması gerekmez. Uzun süre farklı bechmark'lar yaptığınızda 3-4 gün veya 1 hafta herhangi birşey görmüyorsanız bu sefer odağı yazılımlara kaydırmak daha doğru olur. Zira diğerinin çözümü yeni sunucu almak gibi birşey cpu'lar, vrm, memtest'lerden geçse bile ram'lerin değiştirilerek denenmesi demek. 🙂 Mesela DVR demişsiniz ekseri DVR yazılımları çok kötü kodlanmış yazılımlardır saçma sapan crash'lere sebep oluyorlar. Ayrıca bitrate dolayısıyla büyük veri işlenmesi demektir. Mesela bir senaryo siz onboard vga ısısını pek takip edemezsiniz diğer board ısıları yanıltabilir grafik chipset ani aşırı ısınıyorsa register atlama hataları başlar yani sistem crash olur. Bu mesela gpu card'larda genelde uzun süreli sıcak kullanım sebebiyle VRM'lerin ömür tükenmesi şeklinde oluyor malum yüksek elektriksel güce de ihtiyaç oluyor. Akla gelenler c-state kapatın, virtualization, HT gibi option'ları kapatıp deneyin perf. kaybı olacaktır ama çözüm sağlanırsa donanımı bir süre daha kullanma imkanı olur.

CevapAlıntı
Gönderildi : 10/09/2018 20:45
Rıza ŞAHAN
(@rizasahan)
Üye Forum Yöneticisi

[quote user="OZKAN BURGAC"]

Selam ,

 

Açıkçası hp kullanmam tavsiyede etmem Dell Candır gerisi heyecan 🙂

 

Sunucularının üzerinde koşan sistemlerin event log incelemende fayda var belkide sistemlerde tetikleyen bir durum olabilir 

Sunucuların bu restart durumu kronik mi ? Sürekli aynı veya yakın zamanlardamı ?

İlo ile donanımda bir donanım taraması yapman iyi olur

[/quote]

Hocam elektronik şans işidir. Ülkemizde hiç biri yokken adam gibi destek veren HP vardı.

Fiyat politikası v.s. eleştirilebilir ancak HP hala bence diğerlerindne destek anlamında önde.

CevapAlıntı
Gönderildi : 11/09/2018 15:09
ozkanburgac
(@ozkanburgac)
Üye

Selam Rıza hocam ,

Dediğin kesinlikle doğru ama şimdi günümüzde baktığımızda Dell daha önde yoksa HP zamanın efsanesidir ülkemizdeki bazı firmaların tekelindeydi ve onlarda biraz süistimal edilnce antipati oluştu 🙂

CevapAlıntı
Gönderildi : 12/09/2018 12:43
Paylaş:

Lütfen Giriş yap yada Kayıt ol