Forum

Bildirimler
Hepsini Temizle

H-v Cls Diagnostic

13 Yazılar
3 Üyeler
0 Likes
676 Görüntüleme
(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Hyper-v Cluster,

Event log Cluster-Diagnostic; internette bir kaynak bulamadım.

mscs::TopologyPersister::TryGetNetworkPrivateProperties: (2)' because of 'OpenSubKey failed.' (Bu log günde bir kere bir VMnin yedekleme başlangıcında oluşuyor.)

[DCM] IOCTL_STORAGE_QUERY_PROPERTY(StorageDeviceSeekPenaltyProperty): status 31 (Bu log ise her VM yedekleme başladığında oluşuyor.)

Bu problemin hba'nın driver ve firmware güncel olmadığından oluştuğunu düşünmekteyim ki zaten live migration yaptığımda hba'nın driverini update etmem gerektiğini belirten bir log oluşuyor bu noktada şunu sormak istiyorum qlogic fibre channel adapter driver- firmwareni lenovo xpressupdate (serverlerim lenovo) ile update edersem kartın ayarlarıyla ilgili bir sorun oluşur mu yani ayarların sıfırlanması vs. Çünkü şu an sistemde hyper-v cluster aktif olarak çalışıyor.

 
Gönderildi : 20/05/2016 14:51

(@ahmetmusakosali)
Gönderiler: 366
Reputable Member
 

Hyper-V Cluster ın her node unda en az 2 network portu olmalı. Bunlardan biri sadece Cluster sunucularının iletişimi için private (Heartbeat) dediğimiz port ki bu client network subnetinden farklı olmalı. Örneğin sunucu network ünsüz 192.168.1.0/24 ; private bacağı ise 172.22.47.0/24 olur. 

Performans monitör ile 1 hafta sunucunuzu izleyin. Eğer network counter değerlerinde discart çok ve bantwith dolmuyorsa sorun Storage yeterli performansı sağlayamıyordur. Eğer bantwith değeri %50 de ise network hattınız yeterli gelmiyordur

Perfmon üzerinde phisical disk altında read / saniye ve Write /saniye courter değerlerinin ortalaması 20 sn üstünde olmamalı. Bu sizin Storage in yeterli gelmediği ve  latency Yaptığını gösterir. 

Bunlara ek olarak en az yılda 1 kere donanımlarınızın güncellemesini yapmalısınız. Önerilen bu işlemi tek tek manuel yapmanızdan. Fakat HP gibi sunucu üreticileri artık güncelleme paketlerini tek ve toplu bir paket altından yapılıyor. Bu şekilde de yapabilirsiniz önemli olan donanıma ait özel ayarlarınız varsa bunları bir yere not etmeniz bazen bu ayarlar değişebilir

güncelleme yapılacak Cluster node U öncelikle üzerindeki role boşaltılır arkasından da restart edilir. Böylelikle refreşlenmiş olur. 

Not: donanım güncellemeleri donanımın ilişkili bileşenlerinin uyumluluğuna dikkat edilmeli. Mesela HBA Driver sürümünüz 1.2 , yeni sürüm ise 1.7 dir . Storage ise 1.4 e kadar olanına desteği var. Onzaman siz 1.4 ün üstüne kuramazsınız. 

 
Gönderildi : 21/05/2016 20:40

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Sunucularda 4 adet nic var ve hepsi farkli subnette. 1 tanesi heartbeat diger 1 taneside public olarak set edildi. Yukaridaki loglar sadece backup joblar calismaya baslayinca her vm icin 1 kere olusuyor atiyorum saat 12de bir job varsa 12de 1 tane de bu logtan olusuyor, haliyle backup public  nicten calisiyor. Storage ile ilgili olan log ise x adli vm yedeklenirken 1 kere olusuyor. Networkle ilgili olan logun heartbeat ilgili oldugunu mu dusunuyorsunuz? Sunu belirtmek isterim event viewerde kendim gidip cluster-diagnostiic loglari goster dedigimde bu loglari goruyorum. Event viewerda defaultta windows treesindeki cluster-diagnostice bakinca bu loglar gorunmuyor bu da ilginc bir durum.

 
Gönderildi : 22/05/2016 04:34

(@ahmetmusakosali)
Gönderiler: 366
Reputable Member
 

Genel bir performans problemi yaşıyorsunuz. Bu performans probleminin kaynağının disk mi network mü olduğunu söyleyebilmek için 1 hafta boyunca tüm Host'larınızı perfmon üzerinden izlemeniz gerekiyor. Yukarıda verdiğim bilgiler ışığında perfmon değerlerini yorumlayınız.

Bu işlem için öncelikle aşağıdaki xml çıktıını sunucuya kopyalanır  uzantısı xml yapılır.

a) run a Perfmon yazılıp enter a basılarak açılır.

b) Sol daki menülerden “Data Collector Set” altındaki “User Defined” üstüne gelinip sırasıyla “>>  New  >>  Data Collector Set” denilir

c) Acılan menüden uygun isim verilip “create from a template” secilir.

d) Gelen ekranda browser deyip ekte gönderilmiş ve sununucu üzerine kopyalanan dosya gösterilir.

e) sunucu üzerinde uygun alan gösterilir ve finish ile tamamlanır.

 

<?xml version="1.0" encoding="UTF-16"?>

<DataCollectorSet>

                <Status>0</Status>

                <Duration>82800</Duration>

                <Description>

                </Description>

                <DescriptionUnresolved>

                </DescriptionUnresolved>

                <DisplayName>

                </DisplayName>

                <DisplayNameUnresolved>

                </DisplayNameUnresolved>

                <SchedulesEnabled>-1</SchedulesEnabled>

                <LatestOutputLocation>c:\Perfmon-cluster\%hostname%_20160416-01</LatestOutputLocation>

                <Name>cluster-Full</Name>

                <OutputLocation>c:\Perfmon-cluster\%hostname%_AllCounter_20160417-02</OutputLocation>

                <RootPath>c:\Perfmon-cluster</RootPath>

                <Segment>0</Segment>

                <SegmentMaxDuration>0</SegmentMaxDuration>

                <SegmentMaxSize>0</SegmentMaxSize>

                <SerialNumber>2</SerialNumber>

                <Server>

                </Server>

                <Subdirectory>AllCounter_</Subdirectory>

                <SubdirectoryFormat>3</SubdirectoryFormat>

                <SubdirectoryFormatPattern>yyyyMMdd\-NN</SubdirectoryFormatPattern>

                <Task>

                </Task>

                <TaskRunAsSelf>0</TaskRunAsSelf>

                <TaskArguments>

                </TaskArguments>

                <TaskUserTextArguments>

                </TaskUserTextArguments>

                <UserAccount>SYSTEM</UserAccount>

                <Security>O:BAG:DUD:AI(A;;FA;;;SY)(A;;FA;;;BA)(A;;FR;;;LU)(A;;0x1301ff;;;S-1-5-80-2661322625-712705077-2999183737-3043590567-590698655)(A;ID;FA;;;SY)(A;ID;FA;;;BA)(A;ID;0x1200ab;;;LU)(A;ID;FR;;;AU)(A;ID;FR;;;LS)(A;ID;FR;;;NS)</Security>

                <StopOnCompletion>0</StopOnCompletion>

                <PerformanceCounterDataCollector>

                               <DataCollectorType>0</DataCollectorType>

                               <Name>DataCollector01</Name>

                               <FileName>clusterCase</FileName>

                               <FileNameFormat>3</FileNameFormat>

                               <FileNameFormatPattern>ddMMyyy</FileNameFormatPattern>

                               <LogAppend>0</LogAppend>

                               <LogCircular>0</LogCircular>

                               <LogOverwrite>0</LogOverwrite>

                               <LatestOutputLocation>c:\Perfmon-cluster\%hostname%_AllCounter_20160416-01\SP-BYSNODE1_clusterCase16042016.blg</LatestOutputLocation>

                               <DataSourceName>

                               </DataSourceName>

                               <SampleInterval>10</SampleInterval>

                               <SegmentMaxRecords>0</SegmentMaxRecords>

                               <LogFileFormat>3</LogFileFormat>

                               <Counter>\LogicalDisk(*)\*</Counter>

                               <Counter>\Memory\*</Counter>

                               <Counter>\Network Interface(*)\*</Counter>

                               <Counter>\Paging File(*)\*</Counter>

                               <Counter>\PhysicalDisk(*)\*</Counter>

                               <Counter>\Process(*)\*</Counter>

                               <Counter>\Processor(*)\*</Counter>

                               <Counter>\clusterServer:Access Methods\*</Counter>

                               <Counter>\clusterServer:Buffer Manager\*</Counter>

                               <Counter>\clusterServer:Buffer Node(*)\*</Counter>

                               <Counter>\clusterServer:CLR\*</Counter>

                               <Counter>\clusterServer:Databases(*)\*</Counter>

                               <Counter>\clusterServer:General Statistics\*</Counter>

                               <Counter>\clusterServer:Latches\*</Counter>

                               <Counter>\clusterServer:Locks(*)\*</Counter>

                               <Counter>\clusterServer:Memory Manager\*</Counter>

                               <Counter>\clusterServer:Plan Cache(*)\*</Counter>

                               <Counter>\clusterServer:cluster Statistics\*</Counter>

                               <Counter>\clusterServer:Wait Statistics(*)\*</Counter>

                               <Counter>\System\*</Counter>

                               <Counter>\Processor Information(*)\*</Counter>

                               <Counter>\Terminal Services\*</Counter>

                               <Counter>\Server Work Queues(*)\*</Counter>

                               <Counter>\Redirector\*</Counter>

                               <Counter>\.NET CLR Data\*</Counter>

                               <Counter>\.NET CLR Memory(*)\*</Counter>

                               <Counter>\Netlogon(*)\*</Counter>

                              

                               <CounterDisplayName>\LogicalDisk(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Memory\*</CounterDisplayName>

                               <CounterDisplayName>\Network Interface(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Paging File(*)\*</CounterDisplayName>

                               <CounterDisplayName>\PhysicalDisk(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Process(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Processor(*)\*</CounterDisplayName>

                              

                               <CounterDisplayName>\System\*</CounterDisplayName>

                               <CounterDisplayName>\Processor Information(*)\*</CounterDisplayName>

                               

                               <CounterDisplayName>\Server Work Queues(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Redirector\*</CounterDisplayName>

                               <CounterDisplayName>\.NET CLR Data\*</CounterDisplayName>

                               <CounterDisplayName>\.NET CLR Memory(*)\*</CounterDisplayName>

                               <CounterDisplayName>\Netlogon(*)\*</CounterDisplayName>

                              

                </PerformanceCounterDataCollector>

                <Schedule>

                               <StartDate>12/3/2013</StartDate>

                               <EndDate>

                               </EndDate>

                               <StartTime>1:00:00 AM</StartTime>

                               <Days>127</Days>

                </Schedule>

                <DataManager>

                               <Enabled>0</Enabled>

                               <CheckBeforeRunning>0</CheckBeforeRunning>

                               <MinFreeDisk>0</MinFreeDisk>

                               <MaxSize>0</MaxSize>

                               <MaxFolderCount>0</MaxFolderCount>

                               <ResourcePolicy>0</ResourcePolicy>

                               <ReportFileName>report.html</ReportFileName>

                               <RuleTargetFileName>report.xml</RuleTargetFileName>

                               <EventsFileName>

                               </EventsFileName>

                </DataManager>

</DataCollectorSet>

 
Gönderildi : 22/05/2016 14:13

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Tesekkurler Ahmet bey, bugun soylediklerinizi uygulayip sorun neredeymis sonuca bakacagim.  Aslinda sunucular lenovo ve storagrimiz emc'nin mid level skalada olan urunlerinden, uzun vadede kaynak sıkın tısı yasamayalim diyerek bize gerekenden daha ust seviyede donanimlar aldik storage konusunu da outsource destek alarak cozduk.  Anlik olarak dahi Sunucu kaynaklarindan processor ve nic kapasitesinin % 30unu ram kapasitesinin %50sini  bile kullanmiyoruz. Perfmon sonucuna bakalim ne sonuca ulasacagiz, tekrar tesekkurler.

 
Gönderildi : 22/05/2016 16:55

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Verdiğiniz Xml i import etmek istediğimde "the file specified does not contain valid xml" hatası alıyorum. xmlde geçen start date günün tarihi ve c sürücüsüne perfmon-cluster klasörü de oluşturdum fakat aynı hatayı aldım.

 
Gönderildi : 22/05/2016 20:00

(@ahmetmusakosali)
Gönderiler: 366
Reputable Member
 

Kendi sistemimden Export ettiğim için uyumsuzluk yapmış olabilir. İlk etapta size lazım olan değerleri aşağıda yazdım . Bunları full olarak ekleyin (*) şeklinde görülür

LogicalDisk

Network

Physicaldisk

 
Gönderildi : 22/05/2016 23:05

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Bu arada sormak istedigim perfmon 1 hafta boyunca 24 saat sureyle calismasi mi gerekmekte?  Boyle olursa veri boyutu cok fazla olmaz mi? Perfmonu okumayi da bilmek lazim yani verdigi sonucta ne nasil olmali gibi... Bugune kadar daha cok anlik kaynak tuketimini izleyerek bir seyleri cozmusumdur. 🙂  Fakat bu noktada bu yeterli olmadi maalesef.

 
Gönderildi : 23/05/2016 00:19

(@recepyuksel)
Gönderiler: 1893
Üye
 

Mehmet bey merhaba,

En hızlı tarafından VMware'e geçiş yapın kafanız rahat etsin.

Saygılarımla.

************************************************************
Probleminiz çözüldüğünde sonucu burada paylaşırsanız,
sizin ile aynı problemi yaşayanlar için yardım etmiş olursunuz.
Eğer sorununuz çözüldü ise "çözüldü" olarak işaretlerseniz
diğer üyeler için çok büyük kolaylık sağlayacaktır.
************************************************************

 
Gönderildi : 23/05/2016 01:25

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Recep bey haklısınız, nedir çektiğimiz hyper-v'den bilmiyorum, windows update yaptıktan sonra bile ilginç ilginç loglarla karşılaşıyoruz. Storage-cluster olmayan sunucumuzdan daha iyi performans alıyorduk ve yanına bile uğramıyorduk.Bu gidişle hyper-v cluster konusunda kitap yazacağız. 🙂 Sistemi veeam one ile de takip ediyoruz o da günde 2 kere "cluster performance daha collection failure" hatası iletiyor 1 dk sonra düzeldiğine dair mesaj atıyor. Bu kadar sıkıntılı olmamalıydı. Bu aşamadan sonra vmware'a geçmemiz şu an mümkün değil bunu baştan düşünmeliydik.

 
Gönderildi : 23/05/2016 02:09

(@ahmetmusakosali)
Gönderiler: 366
Reputable Member
 

1-) perfmon U oluştururken start Zaman'ı olarak 00:00 stop time olarak 23 saat secin. Bu işlem size dosyanın günlük oluşmasını sağlayacak.

2-) perfmon U okumak için kaydedilen dosyayı çift tıklayın . Açıldıktan sonra counter lar arasında yön tuşlarını kullanarak ilerleyin.

3-) ilk etapda sorununuza ilişkin kontrol noktaları ;

read/sn ve Write/sn : AVG (ortalama) 20 nin üstünde ise Storage tarafında gecikme ( latency) var denektir. 

Bantwith: 1 gbit için 700.000 in üzerinde görürseniz daralma var demektir

Packet Discarted: eğer ortalama değerinde 500.000 den fazla görüyorsanız network problemi yasıyorsunuz  demektir. Eğer bantwith dolu değil iken bu değer yüksek ise Storage performans problemine işarettir. 

4-) eğer Storage üzerinde geçikme göremiyorsanız sorun verinin Storage ile hba arasında bekliyor olabilir. Bu durumda HBA nin güncellemesi ve kablolarının kontrol edilmesi önerilir. 

 

 

 
Gönderildi : 23/05/2016 02:17

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

Çarşamba günü sonucu yazarım, teşekkrler.

 
Gönderildi : 24/05/2016 02:39

(@mehmetergun)
Gönderiler: 204
Reputable Member
Konu başlatıcı
 

 

Veeam backup and replication programı ve backup proxiesler storage üzerindeki sanal makinelerde kurulular. Yukarıdaki eventlerde tam yedekleme başladığı anda oluşuyor problemin bundan kaynaklandığını düşünüyorum.

 
Gönderildi : 26/05/2016 19:26

Paylaş: